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Esipuhe 


Tutkimus peruskoululaisten ja nuorten aikuisten kielenhallinnasta ja 
hallinnan kehityksestä keskittyy siihen varhaislapsuutta myöhempään 
aikaan, jolloin kielelliset tiedot ja taidot monipuolistuvat ja rikastuvat. 
Kielenhallinnan kehitys on elinikäistä, mutta aluksi kyse on kasvamises- 
ta kirjoitetun eli niin sanotun akateemisen kielen hallintaan tavoitteena 
sellaiset kielelliset valmiudet, joita tarvitaan ammatillisessa koulutukses- 
sa ja yhteiskunnassa toimimisessa. Keskitymme tässä julkaisussa perus- 
koululaisiin ja nuoriin aikuisiin. Julkaisu kuuluu tutkimushankkeeseen 
”Suomen kielen myöhempi kehitys: kouluikäiset ja nuoret aikuiset”. 
Hanketta on rahoittanut Koneen Säätiö vuosina 2013-2015 sekä Suomen 
Kulttuurirahasto lukuvuonna 2013-2014. Hankkeen toimintaan on osal- 
listunut joukko tutkijoita Tampereen, Turun ja Jyväskylän yliopistoista, 
ja hyvin monet opiskelijat ovat tehneet opinnäytteensä hankkeen yh- 
teydessä. Kiitämme kaikkia hankkeen toimintaan ja tämän julkaisun 
ilmestymiseen osallistuneita tahoja, mutta ennen kaikkea haluamme 
kiittää kaikkia niitä oppilaita, jotka ovat luovuttaneet hankkeelle aineis- 
toa, kaikkia niitä opettajia, jotka ovat päästäneet meidät tunneilleen, ja 
kaikkia niitä rehtoreita ja muita kouluviranomaisia, jotka ovat antaneet 
tälle toiminnalle luvan. Alaikäisten osalta kiitämme myös lapsensa osal- 
listumiseen luvan antaneita vanhempia. Suurimman kiitoksen ansait- 
sevat aineistoa keränneet ja sitä loputtoman tarkkaavaisesti analysoi- 
neet Hanna-Riikka Hodges ja Soile Itkonen, Maija Muhonen, Kristiina 
Viitala ja Annukka Yli-Paavola. 


Heinäkuussa 2021 
Anneli Pajunen ja Mari Honko 
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Myöhempi kielenkehitys: sanatiedosta 
rakenne- ja tekstitietoon 


Anneli Pajunen 
O https://orcid.org/0000-0001-8597-7491 


Mari Honko 
O https: //orcid.org/0000-0002-3240-622X 


Johdanto 


Taman teoksen aiheena on kielenhallinnan kehittyminen eli kieliyhtei- 
sölle yhteisen kielellisen tiedon vähittäinen lisääntyminen varhaislap- 
suuden jälkeen niin sanotun myöhemmän kielenkehityksen aikana 
(later language development, ks. esimerkiksi Berman 2004; Nippold 
2006). Lukujen päähuomio on suomea ensikielenä oppineissa, äidin- 
kielisissä suomenpuhujissa. 

Kielenhallinta edellyttää tiedostamatonta tai tietoista tietoa kielestä: 
intuitiivista tietoa kielen fonologisesta, morfologisesta ja syntaktisesta 
rakenteesta, näiden tasojen käyttökonteksteista ja käytön pragmaattisista 
ehdoista sekä lisäksi sanastosta. Riittävä kielenhallinta on edellytys kielen- 
käyttötaidoille, kommunikaatiolle sekä lukemaan ja kirjoittamaan oppi- 
miselle. Kielenhallinnan kehitys alkaa puhutusta kielestä, mutta se ei ole 
riippuvainen puhutun ja kirjoitetun kielen modaliteettieroista eikä va- 
rieteettieroista, vaan lapsi ja nuori oppii niitä äidinkielensä merkityksiä, 
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muotoja ja käyttötapoja, joita hänellä on edellytys oppia ja joille hän ympä- 
ristössään altistuu. Kielenhallinta kattaa siis yksilön kaiken kielitiedon, 
se ei rajaudu kirjoitettuun yleiskieleen, vaikka hallinnan kehitystä on 
ehkä helpoin tutkia kirjoitetun kielen kontekstissa ja vaikka juuri myö- 
hemmän kielenkehityksen vaiheissa hallinta laajenee puhutusta kielen 
kirjalliseen käyttöön. Kielenhallinta ja sen kehitys ei edellytä preskriptii- 
visen kieliopin normiston tai termien tuntemusta vaan kielitieto on puhe- 
yhteisölle yhteistä tietoa. Tähän kielen ydinalueeseen soveltuu yksimieli- 
syysperiaate (consensus principle): yleisimmät sanat ja rakenteet hallitaan 
varmasti mutta muutoksenalaisten ja harvinaisten ilmiöiden osalta epä- 
varmuus kasvaa (ks. Labov 1975: 8—9, 30—32; Itkonen 1978: 151-154; 
Hulstijn 2015; 2019). Kielenhallinta kehittyy vielä aikuisiässä mutta lap- 
silla ja nuorilla aikuistasoon pääsy kestää pitkään. Oman tutkimuksem- 
me tavoitteena on ollut tehdä näkyväksi se, mikä on keskeistä yhteistä 
kielellistä tietoa peruskoulun eri vaiheissa oleville ja miten se iän mukaan 
kasvaa ja kehittyy erityisesti kielessä harvinaisempien ilmiöiden osalta. 
Oletus on, että harvinaisten ilmiöiden hallinnassa hajonta on suurta. 
Pieni lapsi oppii kielenkehityksen alkuvaiheissa paitsi äidinkielensä 
(ensikielensä tai -kieltensä) äännerakenteen myös arkipäivän perussanas- 
toa, sanontoja ja fraaseja sekä morfologian ja syntaksin yksinkertaisia 
rakenteita. Kehitys toisin sanoen alkaa varmasta tiedosta (tai siitä tiedon 
osasta, joka ensimmäisenä osoittautuu varmaksi). Puhe kohdistuu 
aluksi pääasiassa konkreettisiin, läsnä oleviin asioihin, ja yksittäisten 
ilmausten viittausala voi olla huomattavasti suppeampi tai laveampi 
kuin aikuisten kielessä (Hoff 2005). Kolmen neljän ikävuoden vaiheilla 
lapsi oppii systemaattisemmin irrottamaan puheensa sisällön puhehet- 
kestä eli kertomaan myös asioista, jotka eivät ole läsnä tai totta (Doherty 
2009; Suomessa esimerkiksi Heimo 2003). Myöhemmän kielenkehityk- 
sen alkuvaiheissa eli noin viisivuotiaana lapsen elämässä alkaa voimakas 
kielellisen kehityksen vaihe. Hän oppii kertomaan suullisia tarinoita ja 
huomioimaan kuulijoita, ja kaikkiaan kielelliset tiedot ja taidot moni- 
puolistuvat ja rikastuvat monella tavalla. Lapsi oppii harvinaisempaa 
sanastoa, useampisanaisia ilmauksia sekä monimutkaisia rakenteita ja 
oppii hallitsemaan kielenkäyttöä erilaisissa tilanteissa. Tarkastelemme 
tässä teoksessa sekä sanaston että kompleksisten semanttisten ja raken- 
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teellisten ilmiöiden kielentämisen kehitystä eri-ikäisillä peruskoululaisil- 
la ja nuorilla aikuisilla. Luku- ja kirjoitustaidon saavuttaminen vauhdit- 
taa lasten kielenkehitystä mutta ne eivät ole kehityksen edellytyksiä. 

Myöhemmän kielenkehityksen vaihe on todellisuudessa jatkumo (life 
span development) mutta sitä tarkastellaan yleensä vaiheittain siten, että 
erotellaan esikoulun ja ensiluokkien vaihe, alakoulun keski- ja loppuvai- 
he, yläkouluvaihe ja sen päättyminen sekä varhaisaikuisuus, josta ede- 
tään elinkaaren mukaisesti vanhuuteen asti (ks. esimerkiksi Nippold 
2006). Aiemmin ajateltiin, että kyse on ikään kuin kehityskaaresta, jon- 
ka alku ja loppu ovat heikomman osaamisen vaihetta (ks. esimerkiksi 
Jakobson 1968). Ajateltiin toisin sanoen, että vanheneminen vaikuttaisi 
kielitietoa ja kielenkäyttötaitoja heikentävästi. Nykyisin ajatellaan ennem- 
min, että suotuisasti vanhentuneen eli esimerkiksi kielelliseen toimin- 
taan vaikuttavilta sairauksilta säästyneen vanhan ihmisen kielenhallinta 
on nuoremman veroinen tai häntä parempikin, vaikka sanat eivät aina 
löydy yhtä nopeasti kuin ennen ja vaikka tarinasta tulee välillä syrjähdel- 
tyä. Samoin jos aiemmin ajateltiin, että nuori aikuinen on kielellisesti 
kuin valmis paketti, nykyisin tiedetään, että kielenkehitys ja -hallinta 
varioi huomattavasti jokaisessa ikävaiheessa. Esimerkiksi nuoret aikui- 
set ovat vielä vaiheessa, jossa kompleksisten rakenteiden hallinnassa on 
puutteita, rekisterit ovat melko kapeat ja sanavarasto parhaimmillaankin 
20-30 prosenttiyksikköä pienempi kuin vanhimmilla ihmisillä (ks. esi- 
merkiksi Kemper & Sumner 2001; Kavé & Halamish 2015; Keulers, 
Stevens, Mandela & Brysbaert 2015). 

Tässä kirjassa keskitymme kielellisen kehityskaaren keskivaiheille, eri- 
tyisesti 12-vuotiaista nuoriin aikuisiin, ja pyrimme esittelemään perus- 
kouluikäisten Suomessa syntyneiden ja suomea äidinkielenään puhuvien 
lasten ja nuorten keskimääräistä kielenhallintaa ja toisaalta näyttämään 
ikäkausittaisen osaamisen vaihtelun. Nuoret aikuiset ovat sekä vertailu- 
kohtana että erillistutkimuksen kohteena. Oletus on, että maahanmuut- 
tajataustaiset peruskoulua Suomessa käyneet lapset ja nuoret tavoitte- 
levat samankaltaista osaamista. Osaamisen erot suhteutuvat Suomessa 
asumisen pituuteen sekä kielellisten kontaktien määrään ja laatuun 
mutta myös lukuisiin yksilöllisiin ja sosiaalisiin tekijöihin (ks. tarkem- 
min Honko 2013; Ruuska 2020). 
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Lähtökohtanamme on, että myöhempi kielenkehitys alkaa puhutun 
kielen pohjalta ja että puhutun ja kirjoitetun kielen ydin on sama mutta 
suhde muuttuu vähitellen vuorovaikutukselliseksi. Oletamme myös, 
että kielenhallinnassa ei ole suuria sukupuolieroja, vaikka niitä voi olla 
kielenkäyttötaidoissa, kuten lukemisessa ja kirjoittamisessa. Tutkimus 
perustuu tutkimushankkeeseen nimeltä ”Suomen kielen myöhempi ke- 
hitys: lapset, nuoret ja nuoret aikuiset”, jonka tuloksia on kirjallisuudes- 
sa esitelty jo jonkin aikaa. Hankkeen julkaisut etenevät ikään kuin elin- 
kaaren mukaisesti: Alkuvaiheessa esillä oli alakouluvaihe (ks. Pajunen 
2012; Honko 2013). Peruskoululaisista ja nuorista aikuisista on myö- 
hemmältä 2010-luvulta useita julkaisuja (Pajunen, Itkonen & Vainio 
2015; 2016; Vainio, Pajunen & Häikiö 2019; Pajunen & Itkonen 2019; 
Laasanen, Pajunen & Häikiö, arvioitavana) ja käsillä oleva kokoomateos 
keskittyy kokonaan tähän vaiheeseen. Vireillä hankkeessa on vanhem- 
pien ihmisten kielenhallinnan tutkimus. 

Tässä yhteydessä keskitymme toisaalta semanttisen tason hallintaan 
(I osio), toisaalta muotojen hallintaan (II osio) peruskoululaisten ja nuor- 
ten aikuisten näkökulmasta. Sanatieto muodostaa kielenhallinnan pe- 
rustan, josta kehitys alkaa ja josta se myöhemmän kielenkehityksen ai- 
kana huomattavasti täsmentyy ja tarkentuu määrällisesti ja laadullisesti 
myös vaikeiden semanttisten ilmiöiden kielentämiseen. Muodot tarjoa- 
vat ne ainekset, joilla merkityksiä kielennetään muiden ymmärrettäviksi 
ilmauksiksi ja teksteiksi. Näkökulmat luonnollisesti limittyvät, vaikka 
lähtökohta on — merkityksestä muotoon ja muodosta merkitykseen — vas- 
takkainen. Metodisesti osiot I ja II eroavat selvästi: I osiossa analyysi 
alkaa semanttisten ilmiöiden kartoittamisesta, II osiossa lähtökohtana 
ovat muodot. 

Sekä sanatieto ja kyky kielentää merkityksiä että tieto muodoista kehit- 
tyvät vähittäin. Tässä teoksessa pyrimme isoilla koehenkilömäärillä osoit- 
tamaan erilaisia kielellisen osaamisen ikäkausimediaaneja ja osaami- 
sen vaihtelua. Tutkimus on toteutettu monimetodisesti käyttäen sekä 
korpustutkimuksen että kokeellisen tutkimuksen metodeja. Tutkimus- 
aineisto on kerätty kynä-paperitestein, kokeellisesti sekä kirjoittamisteh- 
tävillä. Perustelemme seuraavaksi tutkimuksen perusoletuksia, nimit- 
täin sanatiedon keskeisyyttä, puhutun kielen mallia sekä sukupuolten 
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kielenhallinnan samanlaisuutta ja toisaalta ikäkausivaihtelun osuutta. 
Sen jälkeen esittelemme tutkimuksen aineistot ja koehenkilöt sekä 
hankkeen tutkijoiden työnjakoa ja kirjan lukujen näkökulmia. Osiot I ja 
II koostuvat kumpikin neljästä eri luvusta. 

Tutkimuksemme kohdistuu suomen kieleen. Teoksessa käytetty kä- 
sitteistö on kuitenkin ennemmin lingvististä kuin fennististä, koska 
vertailututkimus on pitkälti kansainvälistä. Myös tavoiteltu lukijakunta 
ulottuu fennistipiirin ulkopuolelle. Toivomme, että kirja tarjoaa uusia 
näkökulmia kenelle tahansa lingvistisestä tutkimuksesta sekä suomen 
kielen myöhemmän kehitysvaiheen tutkimisesta, oppimisesta ja opetta- 
misesta kiinnostuneelle. Kirjan luvut sopivat hyvin yksittäinkin esimer- 
kiksi yliopisto-opintojen kurssikirjallisuudeksi. 


PERUSOLETUKSET KIELENHALLINNAN TUTKIMISEEN 
Kielenhallinnan tutkimuksessamme perusoletuksia on ollut neljä: Kie- 
lenkehityksessä sanatiedon laatu ja määrä on keskeistä ja alussa kehityk- 
sen mallina on puhuttu kieli. Kielenhallinta ja sen kehitys ei eriydy 
sukupuolen mukaan, mutta ajallisesti se voi edetä eritahtisesti. Väestö- 
tasolla kielenhallinta on normaalijakautunutta mutta varioi yksilötasolla 
ja kehityksellisesti. Varioinnin keskeinen taustatekijä on kielellinen älyk- 
kyys, mutta siihen vaikuttaa myös muita kielensisäisiä ja kielenulkoisia 
tekijöitä. Käsillä olevan teoksen luvut ja teemat ankkuroituvat näihin 
perusoletuksiin, ja niiden avulla voidaan hahmottaa lasten ja nuorten 
odotuksenmukaista kielenkehitystä ja poikkeamia siitä. 


SANATIEDON KESKEISYYS 

Kielen oppiminen on elinikäinen prosessi, joka alkaa sanojen oppimi- 
sesta ja jatkuu vanhuuteen (ks. esimerkiksi Ramscar, Hendrix, Love & 
Baayen 2013). Yksilön sanastollinen tieto ja taito onkin parhaimmil- 
laan vasta iäkkäillä. Esimerkiksi laajoissa Alankomaissa toteutetuissa 
väestöpohjaisissa nettitesteissä yli 70-vuotiaat tunsivat vajaasta 30 000 
testisanasta yli 80 prosenttia mutta 13-vuotiaat vain vähän yli puolet ja 
nuoret aikuiset noin 60—65 prosenttia (Keulers ja muut 2015). Suomen 
osalta tilanne näyttää samansuuntaiselta (Pajunen, tekeillä). Kuudes- 
luokkalaiset tunsivat testisanoina olleista melko yleisistä liikeverbeistä 
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hyvin noin puolet ja yhdeksäsluokkalaiset noin 6o prosenttia. Nuorten 
aikuisten ryhmässä liikeverbien tuttuus varioi erityisen paljon, jos sana 
oli harvinainen eli sana, jonka esiintymiä on miljoonassa tekstisanassa 
keskimäärin alle yksi (Pajunen & Itkonen 2019). Yksilön sanavaraston 
dynaamisuuden vuoksi voitaisiinkin oikeastaan puhua sanavarannosta, 
joka karttuu ja muovautuu jatkuvasti kielenkäyttökokemuksen myötä. 

Ensimmäinen perusoletuksemme on, että kielen hallinnassa ja sen 
kehittymisessä juuri sanatiedon laatu ja määrä on keskeistä. Siksi sana- 
tiedon arviointi on ollut käsillä olevassa varhaislapsuuden jälkeisessä 
myöhemmän kielenkehityksen tutkimushankkeessa keskiössä. Sanatie- 
don hallintaa on hankkeessa tutkittu monella tapaa, ja nämä tutkimus- 
tulokset ovat taustoittaneet hankkeen muuta tutkimusta. Sanatiedon hal- 
lintaa on arvioitu sekä morfologisten ja semanttisten testien avulla että 
kielenkäytöstä (ks. Honko 2013; Pajunen, Itkonen & Vainio 2015; 2016; 
Vainio, Pajunen & Häikiö 2019; tekeillä); toisin sanoen termiä sanatieto 
ei pidä ymmärtää liian kapeasti. Tämän teoksen ensimmäiset neljä lu- 
kua käsittelevät sanatiedon ja merkitysten hallintaa joko sana-analyysin 
tai semanttis-pragmaattisten ilmiöiden kielentämisen näkökulmasta. 
Kyse on siis itse asiassa kyvystä ilmaista olio- ja tapahtumamerkityksiä 
ja laajemmin tekstuaalisia merkityksiä. 

Sanatason keskeisyyden kielenhallinnassa näkee hyvin esimerkiksi 
suomen johdoksista, joiden käytön määrä ja leksikaalinen monimuotoi- 
suus lisääntyvät iän mukaan lineaarisesti. Tämä on sanaston kasvun 
kannalta merkitsevää, koska suomessa suuri osa sanastosta on joko joh- 
doksia tai yhdyssanoja. Johtaminen on keskeisempi ja vaikeampi ilmiö 
kuin yhdistäminen, koska kaikkien avointen sanaluokkien sanoja johde- 
taan ja koska johtaminen on rekursiivista eli toistuvaa ja osin sisäkkäis- 
tä. Lisäksi sanavartalot varioivat johtamisen yhteydessä ja johtimia, deri- 
vaatiotapoja ja derivaatioketjuja on paljon. Alakoulun päättövaiheessa 
nuori osaa johdoksia sanakohtaisesti mutta ei yleensä sääntöperäisesti. 
Hän saattaa siis tuntea sanan käveleskellä mutta ei yleensä osaa yhdistää 
muita samalla tavalla johdettuja sanoja ryhmäksi tai ei tiedä, mistä kai- 
kista muista sanoista samalla johtimella voidaan tuottaa samantapaista 
lisämerkitystä ilmaisevia sanoja. Suomen tapaisessa synteettisessä kie- 
lessä vasta nuorilla aikuisilla johtaminen on sääntöperäistä siten, että 
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ymmärretään kielessä esiintymättömät sanat mahdollisiksi sanoiksi, jos 
ne on muodostettu sääntöjä (voimakkaasti) rikkomatta (Koivisto 2013; 
Vainio ja muut 2019; ks. myös Berman 2007). Sääntöperäisyyden ym- 
märtäminen on ikään kuin avain systemaattiseen analogiseen mallinta- 
miseen (ks. Itkonen 2005), mutta peruskoululaisia näyttää vielä sitovan 
enemmän ”joko oikea sana tai sitten ei” -ajattelu. Pieni lapsi osaa toki 
hyödyntää analogioita mutta ei kovin systemaattisesti. Johdosten käytön 
lisääntyminen edellyttääkin suomen monimutkaisen sanajohdon sisäis- 
tämistä ja produktiivistumista (Bertram, Laine & Virkkala 2000; Kusnet- 
soff 2017; Vainio ja muut 2019). Sama pätee muista derivaatiorikkaista 
kielistä (ks. Ravid & Avidor 1998; Carlisle 2000; Stekauer, Valeira & 
Körtvelyessy 2012; Clark 2014). Sanojen johtamisen hallinta eroaa vielä 
nuorten aikuisten ja peruskoulun päättövaiheessa olevien välillä, toisin 
sanoen nuoret eivät hallitse derivaatiota vielä 15-vuotiaanakaan täysin 
sääntötasoisesti tai laadullisesti nuorten aikuisten tapaan (Vainio ja 
muut 2019). Vanhempien kielenkäyttäjien osalta tutkimustieto puuttuu. 

Sanatiedon hyvä hallinta ja laaja sanasto on vahvan luku- ja kirjoitus- 
taidon edellytys (ks. esimerkiksi Carlisle 2000; Oian 2002; Nippold 
2006, 25-29, 89; Milton 2009, 170-192; Schmitt 2010, 3-12; Lee 2011; 
suomen osalta Saarela 1997; Honko 2013; Kusnetsoff 2017). On luonnol- 
lista, että lähinnä ikäluokalle tuttua (tai kontekstista pääteltävää) sanas- 
toa ymmärretään luettaessa ja käytetään kirjoituksessa. Luku- ja kirjoi- 
tustaito ovat myöhemmässä kielenkehityksessä keskeisiä saavutuksia, 
mutta ikäluokkatasoinen kielenhallinta on näiden taitojen hallintaan 
oton perusedellytys. Siten luku- tai kirjoitustaito eivät ole tässä tutki- 
muksessa varsinainen tutkimuskohde, mutta jos halutaan tukea kehit- 
tyvää luku- ja kirjoitustaitoa, on tarkoituksenmukaista seurata ja tukea 
myös kielenhallintaa.t 


1 Lukutaitoa on Suomessa tutkittu melko paljon — kirjoitustaitoa jonkin verran — mutta pääasiassa 
esikoulusta koulun alkuun, ei niinkään muiden peruskouluikäisten osalta (ks. Kulju, Kauppinen, 
Hankala, Harjunen, Pentikäinen & Routarinne 2017; ks. myös Tuovila, Kairaluoma & Mustonen, toim. 
2020). Eniten hieman vanhempien peruskoululaisten luku- ja kirjoitustaitoa koskevaa tutkimusta on 
tehty Opetushallituksen toimeksiannoista. Nämä tutkimukset osoittavat samoja kehityslinjoja, joita 
tässäkin tutkimuksessa tulee esille. Lappalaisen monet raportit (ks. esimerkiksi 2003) olivat aikanaan 
yhtenä tämän tutkimuksen innoittajana. 
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Tässä yhteydessä katsomme eri näkökulmista nimenomaan sitä, mitä 
lapset ja nuoret keskimäärin osaavat tietyllä ikätasolla ja miten tämä 
osaaminen muuttuu ja oletettavasti kehittyy ikätasolta toiselle. Lasten ja 
nuorten osaamista verrataan nuoriin suomenkielisiin (ylioppilastutkin- 
non suorittaneihin) aikuisiin, joiden jo voi olettaa hallitsevan äidinkiel- 
tään riittävällä tasolla, vaikka niin kielenkäyttötottumuksissa kuin kieli- 
taidossakin tiedetään esiintyvän vaihtelua (ks. esimerkiksi Malin, Sulku- 
nen & Laine 2013). Tutkimuksemme nuorten aikuisten ryhmä ei edusta 
koko ikäluokkaansa, koska se ei ole tavoitettavissa yhtä helposti kuin 
peruskoululaiset. Lisäksi aikuisten osallistumiseen vaikuttaa tehtävän 
luonne ja sen vaatima aika ja vaivannäkö. Kirjoittaminen on tehtävä- 
tyyppinä vaativa ja karkotti tutkimukseemme jo muuten suostuneita. 
Aikuisryhmä edustaa tutkimuksessa lasten ja nuorten tavoitetasoa eli 
sitä, mihin he voivat pyrkiä ollakseen akateemisilta taidoiltaan itsenäisiä 
toimijoita. 

Käsillä olevassa teoksessa sanatietoa ja merkitysten kielentämistä kä- 
sittelee I osion neljä lukua. Niistä ensimmäinen tarkastelee sanaston 
diversiteettiä, yleisyystasoja ja semanttisia luokkia samasta aiheesta 
kirjoitetuissa kirjoitelmissa, toinen ja kolmas analysoivat semanttisesti 
sanatasoa kompleksisempien ilmiöiden kielentämistä ja neljäs moniää- 
nisyyden ilmaisun kehittymistä tekstitasolla. Lisäksi sanatietoa käsitel- 
lään sanahahmon ja sanarakenteen näkökulmista II osiossa. Hankkeen 
sanatietoa koskevia aiempia julkaisuja ovat muun muassa Honko 2013; 
Pajunen ja muut 2015; 2016; Honko, Jarvis & Vainio 2019; Vainio ja 
muut 2019; Laasanen, Pajunen & Häikiö, arvioitavana; sekä Vainio, 
Pajunen & Häikiö, tekeillä. 


PUHUTUN KIELEN MALLI KIRJOITETULLE 
Toinen perusoletuksemme on, että lapsen kielenkehitys perustuu alku- 
vaiheessaan puhuttuun kieleen ja suulliseen syötökseen. Puhuttu kieli 
on lauserakenteeltaan yleensä melko yksinkertaista ja virkkeet koostuvat 
useammin ketjulauseista kuin alisteisista ja hierarkkisista rakenteista 
(ks. Pajunen & Palomäki 1984). Lapsi käyttää vielä myöhemmän kielen- 
kehityksen alkuvaiheissa puhutun kielen mallin mukaisia perusraken- 
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teita — teksti etenee peruslauseilla? — ja yhdistää niitä konnektiiveilla (ks. 
esimerkiksi Tolchinsky 2004, 236; Berman 2007, 357; Hulstijn 2015). 
Lapsi osaa jo kertoa tarinoita (ks. Suvanto 2012), mutta vain harva kir- 
joittaa niitä. Lapsen sanasto on yleistä ja konkreettista, ja lapsi saattaa 
jo ymmärtää konventionaalisia metaforia mutta alkaa tuottaa niitä itse 
vasta teini-iässä (vrt. Tolchinsky 2004, 238). Koulua aloittava lapsi on 
aika tyypillisesti kirjaimellisen merkityksen vaiheessa ja kaikki kuvain- 
nollinen kielenkäyttö on vähissä. Tässä vaiheessa lasten väliset kielelliset 
kehityserot ovat hyvin suuret. 

Myöhemmän kielenkehityksen aikana sekä puhutun että kirjoitetun 
kielen hallinta kehittyy. Lapsi oppii ymmärtämään puhutun ja kirjoite- 
tun kielen modaliteettieroja ja oppii ottamaan erot huomioon tekstejä 
tuottaessaan. Lisäksi opitaan muut tekstityyppi- ja rekisterierot. Sekä 
sanaston että syntaksin kehitys on huomattavaa (ks. esimerkiksi Berman 
2004; 2007; Nippold 2006). Syntaktisesti kehitys näkyy harvinaisem- 
pien rakenteiden haltuunotosta sekä lauseiden, lauserakenteiden ja teks- 
tijaksojen kompleksistumisesta. Rakenteiden muutosta voi mitata eri- 
laisilla tiheysmittareilla, koska muutokset ovat usein myös määrällisiä. 
Tekstitasolla kehitys näkyy esimerkiksi suunnittelun lisääntymisenä, 
lukijan huomioimisena, ajan ja paikan aiempaa parempana ankkuroimi- 
sena sekä viittausketjujen pitenemisenä. Myöhemmän kielenkehityksen 
aikana opitaan tekstityypit ja opitaan myös yhdistelemään niitä. Lapsi 
ainoastaan linkittää tapahtumia, mutta nuorella kertovaan tekstiin alkaa 
jo ilmestyä kuvailevia ja arvioivia jaksoja (ks. Tolchinsky 2004, 240). 

Tässä tutkimuksessa kielellisen rakenteen kehittymistä yksinkertai- 
sesta monimutkaisempaan tarkastellaan kirjoitelma-aineistolla. Aineis- 
tonkeruun yhteydessä kirjoitelmatehtävä ohjeistettiin tekstityyppiä tai 
-lajia määrittelemättä ”kirjoita päivästä — — (eikä esimerkiksi ”kerro päi- 
västä”). Tuloksena oli iän mukaan pitenevä kirjoitelma yhdestä sanasta 
parhaillaan kertomusrakenteen (Labov & Waletzky 1967) mukaiseen 
kirjoitelmaan ja edelleen kertoviin moniäänisiin kirjoitelmiin, joissa 


2 — Kielitieteessä peruslause (simple basic sentence) on yhden predikaation kielennys ja sekä rakenteeltaan 
että semantiikaltaan yksinkertainen. Peruslause on kaikissa kieliopeissa syntaksin kuvauksen lähtökoh- 
ta ja muodoltaan joko intransitiivi-, transitiivi- tai kopulalause (ks. esimerkiksi Itkonen 2008; 2009; 
Pajunen, Vainio, Hyönä & Bertram, tulossa). 
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oli kuvailevia ja arvioivia jaksoja. Tarinoiden suullinen kertominen voi 
olla hyvaa jo kielenkehityksen varhaisvaiheessa, mutta niiden kirjallinen 
tuottaminen yleensä noudattaa kertomusrakenteen skeemaa — eli sisältö 
koostuu koherentisti — vasta noin 10-vuotiaana (ks. Berman 2007, 348). 
Omassa hankkeessamme ei ole erityisesti keskitytty kertomuksen kehit- 
tymiseen, mutta aineistossamme on havaittavissa selviä viivästymiä tästä 
oletusiästä. 

Tutkimuksemme varsinainen tavoite on tutkia merkityksien kielentä- 
misen ja muotojen hallinnan kehitystä, ei kertovan tekstin tai tekstilajien 
hallinnan kehittymistä. Aineistoa analysoitiin kyllä myös tekstitasolla, 
vaikka se ei ollut ongelmatonta. Ensinnäkin aineiston laadullinen holis- 
tinen arvio (onnistuneisuus, tekstityypin tai -lajin toteutumisen aste) 
osoittautui alakouluikäisten tekstejä lukuun ottamatta vaikeaksi toteut- 
taa, ja arvioijareliabiliteetti vaihteli liikaa (50-80 %). Sisällön laadullinen 
arviointi onkin aina jossain määrin subjektiivista (ks. Kuuskorpi 2012). 
Omat arvioijamme tuntuivat painottavan eri tekijöitä, jotka voi niput- 
taa joko rakenne- tai sisältökriteereihin. Osa luokitteli tekstejä raken- 
teen ja koherenssin mukaan (perusasiat kunnossa tai sitten ei), ja osa 
taas painotti lisäksi tekstin synnyttämää vaikutelmaa (persoonallinen 
ja omaperäinen tai arkipäiväinen ja lattea). Holistisempi analyysi olisi 
edellyttänyt kriteerityyppistä arviointia, joka olisi perustunut kirjoitel- 
mien kokonaisrakenne- tai jaksoanalyysiin, mutta jo sadankin tekstin, 
sadoista puhumattakaan, kertomusskeema- ja jaksoanalyysi on valtava 
urakka (ks. tarkemmin esimerkiksi Juvonen 2004; 2010; Kalliokoski 
2006; 2008; Karjalainen 2008; Juvonen, Virtanen & Voutilainen 2012). 
Toiseksi, vaikka hankkeen kirjoitelma-aineisto on luokiteltu jokseenkin 
systemaattisesti, kaikki tekstitason muuttujat eivät ole luokituksessa 
vielä mukana. Sisällöllisesti tekstitason hallinnan kehitys luonnollisesti 
näkyy koherenssin kautta. Koherenssin lisääntyminen on esillä I osion 
luvuissa, jotka osoittavat kertomuksellisuuden ja koherenssin yhteyden. 

Valinnat ovat perusteltavissa myös siten, että kirjoittaminen on hy- 
vin laaja-alainen ilmiö. Se edellyttää kognitiivista ja neuropsykologista 
kypsyyttä, hienomotoriikan riittävää kehittyneisyyttä, kykyä suunnata 
tarkkaavaisuutta moniin asioihin yhdellä kertaa, toimivaa episodi- ja työ- 
muistia sekä muun muassa kykyä suunnitella (ks. esimerkiksi Hooper 
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ja muut 2011). Kirjoittamiseen vaikuttaa voimakkaasti myös kirjoittajan 
motivaatio, käsitys itsestään kirjoittajana ja usko omiin saavutuksiin (ks. 
esimerkiksi Pajares & Valiante 2001; Routarinne & Absetz 2013). Lisäksi 
tiedetään, että taustatekijöinä on myös yhteiskunnallisia ja ympäristö- 
tekijöitä. Kehityksellisessä kontekstissa lukemisen ja kirjoittamisen tut- 
kiminen edellyttää kognitiivisen profiilin (kuten muistin, motoriikan) 
kontrollointia. Suomessa tällaista tutkimusta ovat tehneet erityisesti 
psykologit ja logopedit (ks. esimerkiksi Niemi 2007; Torppa, Niemi, 
Vasalampi, Lerkkanen, Tolvanen & Poikkeus 2019). Omassa hankkees- 
samme emme lingvisteinä voineet kontrolloida neuropsykologisia omi- 
naisuuksia ja kirjoittajien pystyvyysuskosta emme keränneet tietoa. 
Motivaation rajaamme tässä yhteydessä niin sanottuun ulkoiseen moti- 
vaatioon, esimerkiksi tilannekohtaiseen haluun yrittää tai tehdä jotain. 

Puhutun kielen yksinkertaisempi rakenne kompleksistuu myöhem- 
män kielenkehityksen vaiheessa, kun sekä kielentämisen spesifisyys 
kasvaa että tekstin rakenne tiivistyy. Toisaalta kielennettävät ilmiöt ja 
niitä ilmaisevat rakenteet erilaistuvat (Berman 2007). Lapsen ja nuoren 
pitää kouluikäisenä saada hallintaansa kielellisiä ilmiöitä, jotka eivät ole 
puhutussa kielessä (yhtä) tärkeitä tai jotka eivät vaikuta puheessa. Usein 
kyseessä on heijastuma siitä, että puhetilanteessa osallistujat ovat läsnä 
ja tilanne on yhteinen, joten lisäinformaatiota ei tarvita. Kirjoituksessa 
lukija ei ole tilanteessa periaatteessa läsnä (vrt. kuitenkin Kallionpää 
2014), joten hänen on saatava tilanteinen informaatio haltuunsa muulla 
tavoin kuin havainnoimalla. Siten puhutun kielen malli ei enää yksin 
riitä myöhemmän kielenkehityksen aikana. 

Myöhemmän kielenkehityksen tutkimushankkeessa on osoitettu 
muun muassa, että kompleksisista kielenilmiöistä ei voi rakentaa muu- 
toksen ennusteita puhutun kielen muutoksien varaan ja että hyvin 
kompleksisten ilmiöiden kielentäminen ei onnistu puhutun kielen hallin- 
nan varassa. Pikkulapsilla puhutun kielen malli on ensikielen osalta 
yleensä melko samantapainen olosuhteista riippumatta — tavalliset rutii- 
nit ja lähiympäristö — vaikka ei vaihtelematon. Lasten kasvaessa mallina 
on enemmän kirjoitettu kieli, ja tämä malli erilaistuu puhuttua kieltä 
paljon enemmän yksilöllisesti koulutuksen ja harrastusten mukaan eli 
yhä enemmän kulttuuristen, sosiaalisten ja poliittistenkin syiden varas- 
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sa (Tolchinsky 2004, 235-236). Kompleksisten ilmiöiden kielentämistä 
kuten kehystämistä, referentiaalisen koherenssin ja moniäänisyyden 
ilmaisua, tutkitaan erikseen kolmessa I osion luvussa. Ne osoittavat, että 
semanttis-pragmaattisten ilmiöiden kielentämisen hallintaan saanti on 
jokseenkin hidasta. 

Kielen rakenteen hallinnan osalta keskitymme analyyttisiin, kehityk- 
sellisiin muuttujiin kuten muotojen kompleksistumiseen. Sanaston ja 
morfologian kompleksistumisen lisäksi myös syntaktisen kompleksi- 
suuden eli esityksen tiiviyden kasvu osoittautuu kehitykselliseksi. Sa- 
naston tai morfologisen ja syntaktisen tiiviyden lisääntymisessä ei ole 
mainittavia sukupuolieroja, joskin miespuoliset kirjoittajat suosivat hie- 
man kompleksisempaa ilmaisua. Muotomuuttujia käsitellään erityisesti 
teoksen II osiossa, jossa esillä on puhutun ja kirjoitetun kielen vuoro- 
vaikutuksellisuus, jota arvioidaan muun muassa possessiivisuffiksien 
käyttöön liittyen. Lisäksi osiossa analysoidaan muun muassa äänne- 
kirjain-vastaavuuden kehittymistä sekä morfologisten ja syntaktisten 
muotojen kompleksistumista. 


SUKUPUOLTEN SAMANLAISUUS 

Kolmas keskeinen perusoletus hankkeessa on sukupuolten kognitiivis- 
ten kykyjen keskimääräinen samanlaisuus (gender similarity hypothesis, 
Hyde & Linn 1988; Hyde 2005). Yleisessä älykkyydessä ei katsota olevan 
sukupuolieroja, vaikka eroja voi olla joissain kognitiivisissa kyvyissä, jot- 
ka osaltaan vaikuttavat yleiseen älykkyyteen (Jensen 1998; Hyde 2005; 
Camarata & Woodcock 2006). Esimerkiksi Keith, Reynolds, Patel ja Rid- 
ley (2008) testasivat yleistä älykkyyttä ja kahdeksaa laaja-alaista kognitii- 
vista kykyä ikäluokkiin 6-59 kuuluneella 7 000 koehenkilöllä käyttäen 
Woodcock-Johnson III -älykkyystestejä. Tuloksena löytyi vain kaksi joh- 
donmukaisesti iästä riippumatta ilmenevää sukupuolieroa. Toinen koski 
prosessointinopeutta (processing speed), joka oli naisilla selvästi parempi, 
ja toinen verbaalista kykyä (verbal ability), joka oli miehillä hieman naisia 
parempi. Samaa älykkyystestiä käyttäneet Camarata & Woodcock (2006) 
osoittivat, että lasten ja nuorten osalta on joitain sukupuolittuneita eroja 
mutta että ne ovat jo aikuisilla tasaantuneet. Kun omissa tutkimuksis- 
samme voimme osoittaa, että derivaatiomorfologian tai semanttisen 
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tiedon keskimääräisessä hallinnassa ei ole mainittavia sukupuolittu- 
neita eroja, tilanne on odotuksenmukainen. Pojilla oli reaktioaikoja ja 
virheitä mittaavassa derivaatiomorfologian testissä hieman tyttöjä enem- 
män virhevalintoja, mutta vastaavassa semanttisen tiedon testissä pojat 
olivat tyttöjä selvästi nopeampia. Reynoldsin, Schreiberin, Hojovskyn, 
Schwartzin ja Kaufmanin (2015) mukaan oikeinkirjoituksessa ja kirjoit- 
tamistaidoissa olisi suurimmat sukupuolierot tyttöjen hyväksi. Samat 
erot näkyvät aineistostamme ja saavat paljon huomiota samanlaisuus- 
oletuksen vastaisina (ks. Pajunen 20163). 

Sukupuolierot voidaan jakaa dimorfisiin eli kaksijakoisiin ja allomorfi- 
siin eli tilastollisiin (ks. Heilig 2019). Dimorfiset erot liittyvät yksinomaan 
lisääntymiseen eivät ominaisuuksien jakautumiseen. Allomorfiset suku- 
puolierot jakautuvat Gaussin käyrän mukaisesti siten, että enemmistö 
ihmisistä sijoittuu jakauman keskialueelle, jossa on paljon monien omi- 
naisuuksien päällekkäisyyttä (ks. esimerkiksi kaavio 1). Pienillä jakauma- 
eroilla ei ole päällekkäisyysalueella merkitystä, mutta ne muuttuvat sitä 
tärkeämmiksi, mikä kauemmas keskiarvosta edetään. On kuitenkin 
muistettava, että mikään yksittäinen testi ei määritä yksilön asemaa as- 
teikolla; se voi poiketa suuntaan tai toiseen muun muassa vireystilan tai 
tehtävätyyppien tuttuuden vaihdellessa. Mainittakoon vielä, että suku- 
puolten välisiä kielelliseen älykkyyteenkin kytkeytyviä eroja on pyritty 
tutkimaan myös aivokuvantamisen avulla. Niin sanotussa Philadelphia- 
tutkimuksessa noin tuhannen koehenkilön aivokuvantamistulokset 
osoittivat, että nais- ja miesaivoissa hermosoluyhteydet olisivat erilaisia 
siten, että miesaivoissa olisi vahvemmat yhteydet aivopuoliskon sisällä 
ja naisaivoissa aivopuoliskojen välillä (ks. Ingalhalikar ja muut 2014). 
Tuloksia ei ole yleisesti hyväksytty, koska alkuperäistutkimuksen efekti- 
koot olivat pienet ja koska toisaalta tuloksia on ylitulkittu jopa niin, että 
on aihetta puhua neuroseksismistä (ks. esimerkiksi Ribbon 2016). 

Pitäydymme siis samanlaisuusoletuksessa. Tässä yhteydessä allo- 
morfisten tilastoerojen voi ymmärtää tarkoittavan, että kielenhallinta on 
väestötasolla jatkuva ja normaalijakautunut muuttuja ja että väestötasolla 
ei ole systemaattisia tai merkityksellisiä kielenhallinnan sukupuolieroja. 
Voimme olettaa, että vähintään 70 prosenttia suomenkielisestä väestöstä 
hallitsee äidinkielenä oppimansa kielen ikätasoonsa nähden vähintään 
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-3sd -2sd -1sd ka +1sd +2 sd +3 sd 
AO 55 70 85 100 115 130 145 


Kaavio 1. Keskihajonnat ja älykkyysosamäärät, alueiden prosenttiosuudet (Psyko- 
logiliitto). 


keskimääräisesti ja että pienellä osalla väestöstä (2-3 % asteikon kum- 
massakin päässä) on kielen hallinnassa joko erityisiä vahvuuksia tai 
suuria ongelmia. Hallinta kehittyy iän mukaan tai voi muuttua patolo- 
gisesti. Hallinnan kehitys voi sukupuolittain olla eriaikaista, mutta syyt 
eriaikaisuuteen voivat vaihdella. Oletuksemme on, että hallinnan erot 
näkyvät parhaimmin harvinaisten, vaikeiden tai kompleksisten ilmiöi- 
den kielentämisestä ja että jakaumaeroja selittää kielellinen älykkyys, 
vaikka ei yksin. Yksilötasolla osaamista kuitenkin täytyy arvioida moni- 
puolisemmin kuin väestötasolla, jotta satunnaiset kielenulkoiset tekijät 
tai mittauksen kapeus eivät vaikuta arviointiin. 

Hankkeessa on muun muassa sanaston ja semanttisen tiedon osalta 
saatu melko odotuksenmukaisia tuloksia, kuten jo todettiin, mutta tu- 
lokset myös osoittavat, että peruskoululaisilla osaaminen kehittyy hie- 
man eriaikaisesti. Vaikka keskimääräinen kehitys on monen mitatun 
kielellisen ominaisuuden suhteen molemmilla lineaarista, tyttöjen kehi- 
tys alkaa aikaisemmin kuin poikien. Toisaalta pojat saavuttavat tyttöjä 
koko peruskoulun ajan ja sama linja jatkuu lukiossa (ks. Harjunen, Mar- 
janen & Karlsson 2019, 37—38). Ajallinen kehitysero voi olla luonteeltaan 
biologinen, sosiaalinen tai kulttuurisiin syihin kietoutuva, ja syihin ei 
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sinänsä ole tässä yhteydessä tarve ottaa kantaa. Hankkeessa ei myöskään 
lähtökohtaisesti ole ollut tarvetta eritellä koehenkilöitä sukupuolen mu- 
kaan, eikä koehenkilöiltä ole suoraan kysytty heidän sukupuoltaan. Suo- 
messa viimeisen kahdenkymmenen vuoden aikana käyty laaja keskuste- 
lu poikien heikosta äidinkielen taidosta ja erityisesti kirjoittamistaitojen 
heikkenemisestä (ks. esimerkiksi Lappalainen 2003; 2011) on kuitenkin 
nostanut sukupuolieron yhdeksi tutkimuksen muuttujaksi. 

Uusimman PISA-tutkimuksen mukaan erot näkyvät nykyisin myös 
lukutaidossa ja muissakin oppiaineissa ja lisäksi tyttöjen ja poikien 
erot ovat OECD-maiden suurimmat (ks. Leino ja muut 2019; Saarinen 
2020). Taitoeroja on havaittu tyttöjen ja poikien välillä niin suomen- ja 
ruotsinkielisillä kuin suomea toisena kielenä oppivillakin (Silverström & 
Rautopuro 2015; Kuukka & Metsämuuronen 2016; Kauppinen & Marja- 
nen 2020). Tässä yhteydessä viittaamme äidinkielen hallinnan käsitteellä 
kuitenkin aineistomme laadun vuoksi ensisijaisesti suomea ensikiele- 
nään oppineisiin ja koulussa S1-oppimäärää (suomen kieli ja kirjallisuus) 
opiskelleisiin lapsiin, nuoriin ja aikuisiin. Tarpeen vaatiessa tarkennam- 
me määrittelyä lukukohtaisesti. On huomattava, että PISA-raportin mu- 
kaan (mts. 124) myös oppilaiden välinen sosioekonomisesti selittyvä 
vaihtelu on kasvanut ja vastaavasti koulujen sijainnin ja oppimistulosten 
väliset yhteydet ovat voimistuneet (samoin Harjunen ja muut 2019; 
Saarinen 2020). Sama sosioekonominen vaihtelu näkyy myös omassa 
aineistossamme, vaikka se ei ole muuttujana mukana. PISA-raportissa 
kiinnitetään erityisesti huomiota heikkojen (suomenkielisten) osaajien 
määrän kasvuun, eli toisin sanoen keskimääräisesti osaavien joukko on 
pienentynyt ja heikkojen kasvanut yli ääriarvojen (vrt. myös Kusnetsoff 
2017). Tilanne ei siten enää olisi normaalijakauman mukainen. Tällainen 
poikkeava muutos pitäisi kyetä selittämään. 

Ensimmäiseksi on kuitenkin tärkeintä arvioida, minkälaisia kielellisiä 
sukupuolieroja on ja miten ne voisi selittää. Erot esimerkiksi morfolo- 
gian tai semanttisen tiedon hallinnassa eivät selittäneet saman koehen- 
kilöryhmän kirjoittamistaitojen eroja.3 Siten sukupuolierojen tausta- 


3 Kuuselan (2011) mukaan heikoimmiksi arvioitujen 9.-luokan kirjoittajien lukutaito ja kielentuntemus 
on myös heikkoa, ja taso on näkyvissä samoilla oppilailla jo 7.-luokalla. Kielentuntemus määritellään 
tutkimuksessa melko yleisesti: kieli, sanasto ja peruskäsitteet. 
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tekijä ei ilmeisesti ole (pelkästään) kielitieto eikä kielellinen älykkyys 
vaan kyse on todennäköisesti ennemmin jostain yhteiskunnallisesta tai 
opetuksellisesta tekijästä. Ulkoisen motivaation vähäisyys, kielteinen 
asenne ja pystyvyysuskon puutteet (self-efficacy, ks. Bandura 1997; Kuu- 
sela 2011; Harjunen ja muut 2019) ovat yhteiskunnallisesti latautuneita 
tekijöitä, joten vastuu ei voi olla yksin yksilötasolla. Testaamme tässä 
yhteydessä lähes kaikissa osatutkimuksissa eroja sukupuolen mukaan ja 
tuloksena on, että kirjoituksen kautta mitattavissa muuttujissa jakaumat 
eivät todellakaan aina ole odotuksenmukaisia vaan painottuvat liikaa 
pojilla alakvartiiliin. On monia muuttujia, joissa suunta on alaspäin kai- 
killa peruskouluoppilailla. Kielitiedossa ero ei ole yhtälainen, mikä vai- 
kuttaa merkitykselliseltä, koska kielenhallinta on luku- ja kirjoitustaidon 
kehittymisen lähtökohta ja taustatekijä. 


KEHITYKSELLISET MUUTTUJAT: HAJONTA VAI VARIAATIO 
Neljäs taustaoletus on ollut, että vaikka väestötasolla kielenhallinta on nor- 
maalijakautunutta, yksilötasolla, kehityksellisesti ja suhteessa kielen re- 
sursseihin vaihtelu on suurta. Hankkeessa on tutkittu vaihtelun määrää 
ja laatua monella tapaa ja pyritty arvioimaan, liittyykö vaihtelu lähinnä 
tiettyyn ikätasoon vai liittyykö se myös muihin tekijöihin kuten yksilöi- 
hin tai kielennettävään ilmiöön. Edellisen tapauksen vaihtelua nimitäm- 
me (ryhmätason) hajonnaksi, jälkimmäistä (yksilötason) variaatioksi. 
Edellinen oletuksen mukaan vähenee iän mukaan, joten kyse on kehi- 
tyksellisistä hajontamuuttujista. Jälkimmäinen voi oletuksen mukaan 
myös lisääntyä iän mukaan, joten kyse on myös ikäluokkatasolla mones- 
ta eri syystä varioivista muuttujista. 

Pyrimme löytämään ne muuttujat, joissa vaihtelu liittyy ensi sijassa 
kielenhallinnan suuriin eroihin ikätasolla, ja ne muuttujat, joissa variaa- 
tio syntyy myös kielennyksen vaihtoehtojen — resurssien — suuresta mää- 
rästä. Edellisessä tapauksessa kyse on siis hajonnasta ja oletus on, että 
se tasaantuu ikäryhmittäin. Nuoremmilla ikäryhmäkohtainen hajonta 
voi olla suurempaa kuin normaalijakauma antaisi odottaa, mutta tyypil- 
lisessä kielenkehityksessä sen pitäisi vähetä selvästi iän mukaan (ks. 
esimerkiksi Metsämuuronen 2006; Harjunen, Marjanen & Karlsson 
2019). Selvitämme, mikä on peruskoululaisilla se keskimääräisen hal- 
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linnan alue, jonka alittaminen on hyvä huomata ja johon opetuksessa 
voi reagoida. Vastaavasti pyrimme osoittamaan, missä määrin on kyse 
myös resursseihin liittyvästä variaatiosta. Luonnollisesti sekä hajonta 
että variaatio linkittyvät samoihinkin muuttujiin, mikä tekee arvioinnista 
hankalaa. Esimerkkinä voi mainita sanaluokkaindeksit, joissa sama arvo 
voi viitata kielitaidon kehittyneisyyteen tai kehittymättömyyteen. Esimer- 
kiksi korkea substantiivitiheys voi toisaalta tarkoittaa tiivistä ja argumen- 
toivaa tyyliä, toisaalta sanaluettelomaisuutta. Päätelmiä ei siis pidä tehdä 
yhden muuttujan jakaumista. 

Oletus on, että hajonnan vähenemistä ilmaisevia kehityksellisiä muut- 
tujia löytyy enemmän teksti- ja muototasolla, kehityksellisiä ja varioivia 
enemmän merkityksen kielentämisessä. Tämä selittyy yksinkertaisim- 
millaan siten, että yksikköjä on muototasolla suhteellisen vähän ja mer- 
kitystasolla paljon. Kehityksellisiä muuttujia tutkimme koululaisryhmäs- 
sä pääasiassa näennäis- ja reaaliaikametodilla vertailukohtanamme 
nuoret aikuiset. Kielentämiserojen kautta syntyvä variaatio näkyy luotet- 
tavimmin aikuisikäluokkatasolla, jossa kielenhallinta on jo vähintään 
perustasolla eli jossa kielenhallinnassa ei ole oleellisia puutteita. Perus- 
kouluikäisillä hajonta- ja varioivia muuttujia on paikoin hyvin vaikea 
pitää erillään ilman yksityiskohtaista laadullista analyysiä. 

Varioivia muuttujia eli kielentämisen erojen lähteitä on viime aikoi- 
na tutkittu erityisesti tapahtumien kielentämisen yhteydessä ja on voitu 
osoittaa, että lähteitä on yksilöstä, stimuluksesta ja kielellisestä toiminta- 
ympäristöstä, havainnosta ja ympäristötekijöistä koulutuksen määrään 
(ks. Bohnemeyer ja muut 2014; Palmer, Lum, Schlossberg & Gaby 
2017). Yksilöllistä variaatiota voi syntyä esimerkiksi sen mukaan, että 
perkeptiivinen ja kognitiivinen prosessi, jossa huomio (attention) kiin- 
nittyy yksittäisiin ärsykkeisiin, on hyvin valikoiva ja yksilöittäin vaihte- 
leva (Baker & Levin 2015). Koehenkilö voi tilanteittain yksinkertaisesti 
olla näkemättä jotain tai tulkita näkemänsä väärin (change blindness, ks. 
Gibbs, Davies & Chou 2016). Lisäksi siinä missä yksi näkee yksityiskoh- 
tia ja kielentää ne, toinen kielentää yleisemmällä tasolla. Muisti, näkö- 
kyky ja stressi vaikuttavat huomiokykyyn. 

Kielentämisstrategiat voivat vaihdella yksilöllisesti mutta myös kehi- 
tyksellisesti. Pieni lapsi voi kertoa lukijaa huomioimatta pitäen itseään 
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keskipisteenä, nuori voi kehystää tarinaansa enenevästi, mutta yleensä 
vasta aikuinen tiivistää ajallisesti ja vaihtelee tarinan tapahtumajärjestys- 
tä ja näkökulmia. Iän myötä kyky suunnitella kasvaa. Variaatiota syntyy 
myös kielennykseen käytettävissä olevista kielen resurssien määristä ja 
niiden vaihtelevasta hallinnasta. Jos käytettävänä on vain yleisiä sanoja 
tai muotoja, kerronta on monen mitattavissa olevan muuttujan kannalta 
erilaista kuin jos tuntee ja käyttää yleisten sanojen tai muotojen spesi- 
fimpiä vastineita. Myös tekstityyppien iän mukana kasvava monipuolis- 
tuminen vaikuttaa variaatioon ja toisaalta monet mittarit reagoivat teks- 
tin ominaisuuksiin. Jos kirjoitetussa kielessä on paljon kehityksellistä 
variaatiota, variaatio voi perustua myös kulttuuriseen tai muuhun yksi- 
lölliseen erilaistumiseen. 

Kehityksellinen hajontavaihtelu on esillä pääosassa teoksen luvuista, 
mutta myös kielentämisen (kehitykselliseen) yksilövariatioon kiinnite- 
tään kaikissa teoksen luvuissa huomiota. Erikseen sitä tarkastellaan spa- 
tiaalisen kehystämisen yhteydessä, muun muassa koska siihen suomen 
kielessä on tarjolla paljon kielen resursseja ja toisaalta yksilöllisiä kielen- 
tämisstrategioita. Tekstitasoista variaatiota tarkastellaan muun muassa 
possessiivisuffiksien käyttöä tutkimalla. Molemmissa luvuissa koehenki- 
löt ovat pääasiassa nuoria aikuisia. Kehityksellinen vaihtelu tulee esiin 
myös tekstin koherenssin — referentiaalisen, spatiaalisen, temaattisen ja 
temporaalisen — kehittymisen yhteydessä (ks. esimerkiksi Givön 1993; 
2017). 

Painopiste on kehityksellisissä varioivissa muuttujissa I osion luvuis- 
sa ja kehityksellisissä hajonnan pienenemistä ilmaisevissa muuttujissa 
II osion luvuissa. Edellisessä lähtökohtana on kielennettävän ilmiön 
semanttinen ja laadullinen analyysi, jälkimmäisessä muotojen käyttö. 
Edellisessä variaatio voi lisääntyä iän myötä, jälkimmäisessä vaihtelu 
voi vähetä, kun saavutetaan ikäluokkatasoinen keskimääräinen taso. 
Molemmissa tapauksissa taustalla on luonnollisesti myös kielelliset 
älykkyyserot. 


TUTKIMUSKYSYMYKSET JA -METODIT 
Edellä käsiteltyjen taustaoletusten kautta muotoutuvat myös tämän teok- 


sen keskeisimmät tutkimuskysymykset: 
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1) Miten sanatiedon ja semanttisen tiedon hallinta kehittyy? 

2) Miten kielen hallinta muotojen tasolla kehittyy? 

3) Miten sukupuolierot näkyvät kielenhallinnassa? 

4) Milloin vaihtelu tasaantuu ja milloin ei, eli milloin vaihtelun vä- 
heneminen on kehityksellistä ja milloin kyse on myös kielellisestä 
ja yksilöllisestä variaatiosta, jonka määrä ei ole sidoksissa pelkäs- 
tään kehitykseen? 


Kielenhallintaa on hankkeessa tutkittu monimetodisesti ajatuksena, että 
käyttämällä sekä korpus- että kokeellisia metodeja voidaan tutkittavasta 
ilmiöstä saada kokonaisvaltaisempi kuva. Korpusaineistoa on usein 
vaikea arvioida ilman tietoa koehenkilöreaktioista tai ilman laadullista 
etukäteistietoa, joten tietoa on kerätty myös kyselyin ja elisitoimalla (ks. 
Itkonen & Pajunen 2010). Aineiston ensivalinta ja analyysi on kuitenkin 
aina ollut luonteeltaan laadullista käsiteanalyysiä. 

Sekä korpus- että testiaineisto analysoidaan laadullisesti ja tilastolli- 
sesti. Laadullinen analyysi nojaa aineistojen sana-, lause- tai tekstityyppi- 
koodaukseen ja tilastollinen analyysi on tässä yhteydessä ennen kaikkea 
kuvailevaa, koska tavoitteena on osoittaa osaamisen vaihtelu. Teoksen 
tehtävä ei ole osoittaa erojen tilastollista merkitsevyyttä, mutta isot koe- 
henkilömäärät takaavat sen, että eri mittarien kautta arvioituina erot ikä- 
ryhmittäin ovat tilastollisesti pääasiassa merkitseviä. Muissa yhteyksissä 
julkaistuissa artikkeleissa tuloksia on analysoitu myös monimuuttuja- 
menetelmin. 

Tutkimushankkeen ja tämän teoksen keskeisin ja tärkein tutkimustu- 
los on, että peruskoululaisilla ikäkausiosaamisen hajonta on hyvin suur- 
ta. Lisäksi tendenssinä on, että koko populaatiossa alakvartiilitason osaa- 
jien määrä kasvaa. Myös muissa yhteyksissä on todettu, että äidinkielen 
hallinnan erot alkavat olla tasavertaisten opiskelumahdollisuuksien ta- 
kaamisen kannalta liian suuria (vrt. myös Pöysä & Kupiainen 2018). 
Äidinkielen hallinta peruskoulun loppuvaiheessa näyttää ennakoivan 
melko voimakkaasti esimerkiksi menestymistä myöhemmin ylioppilas- 
kokeissa (Harjunen ja muut 2019). Tämä on nähtävissä sekä äidinkielen 
ja kirjallisuuden kouluarvosanan ja tutkintomenestyksen välisenä korre- 
laationa että oppiainearvioinnista riippumattomalla tekstitaitomittarilla 
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arvioituna (mts. 11-12). Viimeisimmän lukutaitoa mittaavan PISA-kartoi- 
tuksen perusteella heikkojen lukijoiden osuus on kasvanut Suomessa 
selvästi eli 8,1 prosentista 13,5 prosenttiin (OKM 2019). Tämä merkitsee, 
että Suomessa on yhä enemmän nuoria ja nuoria aikuisia, joiden kielel- 
liset taidot voivat rajoittaa heidän itsenäistä toimintaansa tekstittyneessä 
yhteiskunnassa. Tilannetta ei voi selittää kielellisen älykkyyden väestö- 
tason jakaumalla, ja suurimmat ongelmat koskevat poikia ja heidän 
jatko-opiskelumahdollisuuksiaan. 


AINEISTO 

Hankkeen tutkimukset perustuvat empiiriseen aineistoon. Aineisto 
on kerätty useammassa vaiheessa, ja sisällöllisesti se on jaoteltavissa 
sähköiseen korpusaineistoon, kyselyin ja testein tuotettuun aineistoon 
sekä kirjoitustehtävillä koottuun aineistoon. Useimmiten yksi ja sama 
koehenkilö on tuottanut useammanlaista aineistoa samalla kertaa tai 
eriaikaisesti, mikä mahdollistaa vertailun kielen eri osa-alueilla tai kehi- 
tyksellisesti. Pääosin kehitystä kuitenkin tutkitaan näennäisaikametodin 
avulla. 


SÄHKÖISET KORPUKSET 

Korpukset koostuvat sanomalehtiaineksesta, fiktiosta, alakoulun oppikir- 
joista ja nuorten aikuisten ylioppilaskirjoitelmista, ja ne ovat kaikki säh- 
köisessä muodossa ja automaattisesti koodattu. Sanaesiintymämäärä on 
yhteensä noin 45 miljoonaa. Lehtiaines on Helsingin Sanomista (Pajunen 
& Virtanen 2002a), Savon Sanomista (Pajunen & Virtanen 2002b) ja 
Turun Sanomista (Laine & Virtanen 1999b). Fiktioaines on 2000-luvulla 
ilmestyneistä, lähinnä jännitys- tai salapoliisiromaaneiksi luokiteltavis- 
ta teoksista ja oppikirjat edustavat 2000-luvun alakoulun oppikirjoja 
(ks. Jaakola 2004). Kirjoitelmakorpus on koostettu ylioppilaskirjoitel- 
mia esittelevistä kirjoista ja sen sanamäärä on yhteensä miljoona.t Kun 
muut korpusaineistot edustavat 2000-luvun kieltä, kirjoitelmakorpuk- 


4 Kirjoitelmakorpus on koostettu Suomalaisen Kirjallisuuden Seuran ja Äidinkielen opettajain liiton 
julkaisemista ainekokoelmista, jotka aluksi keskittyivät niin sanottuihin valioaineisiin eli erityisen hy- 
viksi arvioituihin kirjoitelmiin. Myöhemmin valikoima on monipuolistunut eri arvosanoja saaneisiin 
kirjoitelmiin. Laadulliset sisällölliset erot eivät ole tutkimuksessamme mukana. Korpus ei ole julkinen. 
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sessa on tekstejä vuosilta 1948-2003. Lisäksi aineistossa on pieni määrä 
1970-luvun Lauseopin arkiston materiaalia ja siihen pohjaavia kirjoite- 
tun ja puhutun kielen tietoja (ks. Pajunen & Palomäki 1984). Lauseopin 
arkiston (= LA) aineisto on 1970-luvun kirjoitettua yleiskieltä Oulun 
korpuksen jakauman mukaan koostettuna (sanomalehdet, aikakausleh- 
det sekä ei-fiktiivinen kirjallisuus, ks. Saukkonen 1982) tai se edustaa 
aluemurteita. 

Korpukset — LA:ta lukuun ottamatta — on koodattu morfosyntakti- 
sesti FDG-jäsentimellä (functional dependency grammar, ks. Voutilainen 
2002) ja ne on koottu konkordanssityyppisiksi tietokannoiksi (Laine & 
Virtanen 19993; Virtanen & Pajunen 2001). Korpuksista voi tehdä ha- 
kuja lekseemin tai sanamuodon, sanaluokan, funktion, muodon ja frek- 
venssin avulla. Tarpeen vaatiessa hakusanan esiintymäympäristöä voi 
rajata paitsi edellä mainituin muuttujin myös etäisyyden tai pääsanan 
suhteen. Sähköisiä korpuksia on käytetty frekvenssien ja vertailulukujen 
laskemiseen ja testisanojen vertaistamiseen. Possessiivisuffiksien käy- 
tön tutkimus perustuu sähköiseen korpusaineistoon. 


TESTIT JA KIELENTÄMINEN 
Testien avulla on elisitoitu eli kirvoiteltu suunnitelluilla asetelmilla 
monenlaista kielellistä ainesta. Testien yhteydessä on tuotettu myös 
kielentämis- ja kirjoittamistehtäviä. Kirjoitustehtävänä on ollut joko 
kirjoitelma unelmapäivästä, kuvan tai tapahtuman kielentäminen tai 
kuvasarjatarinan kertominen. Aineistot on kerätty vuosina 2007-2020. 
Testauskokoonpanoja on useammanlaisia: 
a) Määritelmätesti, sana-assosiaatiotesti, derivaatiotesti (kaikki pa- 
peri- ja kynätestejä), kirjoitelma unelmapäivästä, tietoa morfolo- 
gian hallinnasta ja muun muassa ylioppilastutkintotodistuksesta. 
Koehenkilöinä on nuoria aikuisia yhteensä 240 (ks. myös Pajunen 
ja muut 2015; 2016; Laasanen ja muut, arvioitavana). 
b) Semanttisen ja morfologisen leksikaalisen päätöksen kaksi tes- 
tiä, molemmat elektronisia online-testejä reaktioaikoineen, kir- 
joitelma unelmapäivästä. Koehenkilöinä on kuudes- ja yhdeksäs- 
luokkalaisia sekä nuoria aikuisia yhteensä 300 (myös Vainio ja 
muut 2019; Vainio, Pajunen & Häikiö tekeillä). 
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c) Määritelmätesti, sana-assosiaatiotesti, vapaa assosiaatiotesti, kir- 
joitustehtävänä kuvan kielentäminen, tuttuustesti, reitin kielentä- 
mistesti. Koehenkilöinä on 157 kuudes- ja yhdeksäsluokkalaista 
(Pajunen, tekeillä). Testit antavat tietoa peruskoululaisten sanaston- 
hallinnasta ja erityisesti spatiaalisten ilmiöiden kielentämisestä. 
d) Sanatiedon hallintaa mittaavat testit ja kirjoitelma, taustatieto- 
lomake, tieto arvosanoista ja opettaja-arvio. Pitkittäistutkimus 3.- 
4.- ja 5.-6.-luokkalaista, kaikkiaan noin 600 Sr- ja S2-koehenkilöä. 
(Tuloksista ks. Honko 2013). Luku norminmukaisuuden hallinnan 
kehityksestä perustuu tähän aineistoon, mutta Hongon laaja ai- 
neisto (2013) taustoittaa koko hanketta monella tavalla. Tämä on 
hankkeen ainoa osio, jossa S2-oppijoita on edustavasti mukana. 
e) Suullinen videoitujen liike- ja tilatapahtumien kielennys 
Trajectoire-videosarjan (ks. Ishibashi, Kopecka & Vuillermet 2006) 
ja fiktiivisen liikkeen (ks. Blomberg 2014) kuvasarjan avulla. Koe- 
henkilöinä on 50 nuorta aikuista. Testit antavat tietoa nuorten ai- 
kuisten spatiaalisten ilmiöiden kielentämisestä. Trajectoire koostuu 
76 videoklipistä, joista 55 esittää varsinaisen liiketilanteen, kaksi on 
tehtävänannon yhteydessä katsottuja harjoitusvideoita ja loput ovat 
”fillereitä” eli mukana tutkimuksen tarkoituksen hämärtämiseksi. 
Videot ovat kymmenisen sekuntia pitkiä, ja niissä on näyteltyjä 
liiketilanteita vaihtelevissa luonnonympäristöissä. Kuvasarjassa on 
36 tilaa ilmaisevaa piirrettyä kuvaa. 

f) Suullisia nimeämis- ja kielennystehtäviä; Olion- ja tapahtuman 
nimeäminen 800 kuvan avulla (vrt. Szekely, D'Amico, Devescovi, 
Federmeier, Herron, lyer, Jacobsen, Arévalo, Vargha & Bates 2005), 
koehenkilöinä 6o aikuista. Nimeäminen 100 kuvan avulla, koe- 
henkilöinä 50 nuorta aikuista. Kuvakirjakerronta Mayerin (1969) 
Frog, where are you? -kuvakirjasta (ks. Strömgvist ja Verhoeven 
2004), koehenkilöinä 35 nuorta aikuista. Testeistä osa on toteutet- 
tu elektronisina. Testit antavat tietoa nuorten aikuisten sanaston- 
hallinnasta. 

g) Joukko semanttisia subjektiivisia testejä, joissa on koehenkilö- 
arvioita tiettyjen sanojen tuttuudesta, konkreettisuudesta, kuvitteel- 
lisuudesta, abstraktiudesta tai sanan herättämästä tunteesta tai sen 
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merkityksestä asteikolla positiivinen-negatiivinen (ks. esimerkiksi 
Söderholm, Häyry, Laine & Karrasch 2013; Citron, Cacciari, 
Kucharski, Back, Conrad & Jacobs 2016). Koehenkilöinä on yhteen- 
sä noin 200 peruskoululaista ja nuorta aikuista. Subjektiivisten 
testien avulla on vertaistettu varsinaisia kokeita, mutta niiden avul- 
la voi selittää myös lasten ja nuorten tekemiä valintoja ja arvioida 


sanaston kehitystendenssejä. 


Testit ovat antaneet runsaasti tietoa sanatiedon laadusta ja määrästä 
kouluikäisillä ja nuorilla aikuisilla. Testeillä tuotettu aineisto on analy- 
soitu soveltuvin kielensisäisin ja -ulkoisin muuttujin Excel-tietokantoi- 
hin siten, että samojen koehenkilöiden eri testitulokset voi yhdistää. 
Lisäksi on laskettu erilaisia frekvenssivertailulukuja. Elektroniset testit 
on toteutettu ohjelmalla Pohjankukka & Vainio (2013) tai ohjelmalla 
E-Prime-3 joko ryhmittäin samassa tilassa tai yksilötestauksin. Kaikki 
käytetyt testityypit, myös kynä-paperitestit, noudattavat yleisesti kielitie- 
toa testaamaan käytettyjä testiformaatteja, jotka tutkimusryhmä on so- 
veltanut suomen kieleen. Koska niitä on käytetty onnistuneesti samanta- 
paisissa konteksteissa aiemmin, niitä voi pitää valideina kielenhallinnan 
osa-alueiden testaukseen. 


UNELMAKIRJOITELMAT 

Kirjoitelma-aineisto on kerätty vuosina 2006-2010 ja 2012—2014 ja se 
koostuu alakoululaisten, yläkoululaisten sekä nuorten aikuisten kirjoitel- 
mista (ks. taulukko 1). Vanhimman aineiston ytimenä on Maija Purasen 
ja Annukka Yli-Paavolan keräämä alakoululaisaineisto, jota on muuta- 
man koulun erillisaineistolla täydennetty parina alkuperäiskeruuta seu- 
ranneena vuonna (= niin kutsuttu Koulukorpus, ks. Pajunen, Puranen 
ja Yli-Paavola 2010). Alakouluaineistossa on kaupunki-, taajama- ja haja- 
asutusalueen kouluja sekä kielikoulu- ja kielikylpyluokka. Koko alakou- 
lun aineisto on kerätty maaliskuussa, jotta mahdollisimman moni en- 
simmäisen luokan oppilaista jo osaisi lukea ja kirjoittaa. Maaliskuu on 
myös alakoulun lukutestin vertailukuukausi (Lindeman 2000, 3). Vuo- 
sina 2013 ja 2014 kerättyyn kouluaineistoon kuuluu alakoulun kuudes 
luokka ja yläkoulun aineistoa. Keruu on toteutettu vastaavilta alueilta ja 
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myös siihen on valikoitunut yksi kieliluokka. Vanhempien koululais- 
ten osalta keruuajalla ei katsottu olevan enää merkitystä, koska kielelli- 
set valmiudet ovat paremmat. Tähän aineistoon eli niin kutsuttuun 
Unelmakorpukseen (ks. Pajunen 2016b) on yhdistetty myös aiempi 
kuudensien luokkien aineisto. Näin mahdollistuu eri aikoina kerätyn 
kuudensien kirjoitelmien vertailu. Unelmakorpukseen kuuluu paitsi pe- 
ruskoululaisten kirjoitelmia myös nuorten aikuisten kirjoitelmat, jotka 
on kerätty suomen kielen pääsykokeen yhteydessä tai ammattikorkea- 
koululaisilta vuosina 2012-2014. Koulukorpuksen rinnakkaisaineisto 
(= ns. S1-S2-korpus), jossa on yhteensä 550 Sr- ja S2-kirjoittajien kirjoi- 
telmaa, on kerätty vuonna 2007 (toinen ja kolmas luokka) ja 2010 (vii- 
des ja kuudes luokka). Unelma-aineistoihin viitataan joko korpuksen 
nimellä tai lyhyemmin esimerkiksi sanalla Unelmakirjoitelmat. 


Taulukko 1. Koulu- ja Unelmakorpuksen kirjoitelmien määrä. 


Ikäluokka F M Kaikki 
Alakoulu 1.-5. 481 466 947 
Kuudennet 162 158 320 
Ylakoulu 137 133 270 
Aikuiset 244 98 342 
Yhteensä 1024 855 1879 


Unelmakirjoitelmat on kirjoitettu samasta aiheesta eli unelmien päivästä 
samalla tehtävänannolla: ”kirjoita unelmiesi päivästä, jonka olet kokenut, 
haluaisit kokea tai voisit kokea maailmassa, missä mikä tahansa olisi 
mahdollista” (ks. Pajunen 2012). Aikaa kirjoittamiseen on ollut yksi oppi- 
tunti ja etukäteissuunnittelua ei ole ollut.* Kirjoitelmien kokonaissana- 
määrä kasvaa lineaarisesti peruskoulun ikäluokasta toiseen yhdestä sa- 
nasta muutamaan sataan, aikuisia puolestaan on pyydetty kirjoittamaan 
noin 300 sanan kirjoitelma (ks. taulukko 2). Sanaesiintymien määrä 
koko aineistossa on noin 234 000. S1-S2-korpus on kirjoitettu aiheesta 
Unelmien päivä (ks. Honko 2013), ja sen sanamäärä on noin 60 000. 


F = tytöt ja naiset, M = pojat ja miehet. 

6 Sintonen (2011) vertaili suunnittelemattomia ja suunniteltuja Unelmakirjoituksia pro gradu -tutkiel- 
massaan. Tuloksena oli, että suunnittelu toisaalta nostaa tekstin tasoa, toisaalta yhdenmukaistaa 
kirjoitelmia. 


wu 
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Tehtävänanto on ollut Unelmakirjoitelmia täsmällisempi ja kirjoittajia on 
opastettu kirjoittamaan satu tai tarina. Alussa on keskusteltu unelman 
käsitteestä. Aiheen ja ohjeistuksen ero näkyy aineistossa jonkin verran. 


Taulukko 2. Sanaesiintymien määrä Unelmakirjoitelmissa. 


Ikäluokka / Sanaesiintymiä n Keskimäärin 

kirjoittajittain 
Alakoulu 1.-5. 63 641 67,2 
Kuudennet 42.605 133,1 
Yläkoulu 38365 142,1 
Aikuiset 89192 260,8 
Yhteensä 233803 


Kirjoittajien motivaatio (halu suostua kirjoittamaan tai viitseliäisyys) 
näyttää vaihdelleen yksilöittäin ja myös ryhmittäin.? Uusimmissa keruis- 
sa motivaatiota on pyritty tasaamaan arpomalla kirjoittajien kesken pie- 
niä palkintoja. Motivaation nostatus näyttää kasvattaneen sanamäärää 
mutta ei ole niinkään lisännyt rakenteen suunnittelua — ja kirjoitelman 
tasoa —, mikä näkyy, jos verrataan vuosien 2006 ja 2014 kuudensien 
aineistoja keskenään (ohjatun suunnittelun vaikutuksesta ks. Sintonen 
2011, motivoinnista ks. myös Kyösti 2018; motivaation osatekijöistä ja 
vaikutuksesta ks. Troia, Harbaugh, Shankland, Wolbers & Lawrence 
2013). Aikuisista ammattikorkeakoululaisille on maksettu rahapalkkio; 
pääsykokeeseen osallistuville itse koetilanne on ollut motivoiva. 

Koko Unelma-aineisto (eli Koulu-, Unelma- ja S1-S2-korpus) on en- 
sin kirjoitettu sähköiseen muotoon teksteiksi ja koodattu myöhemmin 
manuaalisesti sana kerrallaan Excel-tietokantaan. Jokainen sanaesiinty- 
mä on luokiteltu sanarakenteen ja sanaluokan mukaan sekä syntaktises- 
ti että semanttisesti. Kaikki sanaesiintymät on myös kantasanaistettu eli 
muutettu lekseemeiksi. Aineisto on koodattu myös sanatasoa ja lausetta 
laajempiin yksiköihin, joista voidaan arvioida muun muassa kirjoitel- 


7 Aineiston kerääjät välittivät usein koehenkilökommentteja ja kuvailivat keruutilanteen tunnelmaa 
tai häiriötekijöiden määrää; nämä antoivat tukea päätelmiin kirjoittajien (ulkoisesta) motivaatiosta. 
Koehenkilöt saattoivat myös kysyä, vaikuttiko suoritus oppiainearviointiin; vastaus luonnollisesti oli 
kielteinen. Sisäinen motivaatio ei ole tällaisilla havainnoilla arvioitavissa, joten viittaamme termillä 
motivaatio juuri ulkoiseen motivaatioon. 
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mien syntaktista hierarkkisuutta ja erilaisia leksikaalisia suhteita. Lisäksi 
esitetään tekstityyppiä ja koko kirjoitelmaa koskevia holistisia arvioita, 
mutta on syytä muistaa, että ei ole olemassa sellaisia holistisia hyvän 
kirjoitelman kriteerejä, joista vallitsisi yksimielisyys (ks. esimerkiksi 
Koutsoftas & Gray 2012, 407; Bouwer, Beguin, Sanders & van der Bergh 
2015, 95). Tasomuuttujaa käytettiin vain alakouluaineistossa, koska siinä 
tasoerot olivat selvän kehitykselliset. Aineiston koodaajina on ollut usei- 
ta henkilöitä, ja koodausta on testattu ja yhtenäistetty määrittelemällä 
tarkat sana-, sanaluokka- ja sanarakennekriteerit, semanttisen analyy- 
sin kriteerit sekä lause- ja tekstitason analysointikriteerit perus- ja raja- 
tapauksineen. Muuttujien määrittelyä on usein jouduttu tekemään sekä 
sana- että tekstikontekstissa. Rajanveto on usein vaikea vaikkapa sub- 
stantiivien ja adverbien välillä. Aineiston koodisuunnitelmassa on yli 
60 sivua, ja juuri koodaus on ollut tutkimuksen työläin vaihe. Tulokset 
luonnollisesti perustuvat aineiston yksityiskohtaiseen koodaukseen, joka 
on sama kaikissa osatutkimuksissa. Korpuksia on käytetty myös kymme- 
nissä opinnäytetöissä, ja opiskelijat ovat saaneet aineistonsa valmiiksi 
koodattuna. Siten nämä opinnäytetöiden laadulliset analyysit täydentä- 
vät hankkeen tutkimusta luotettavasti. 

Koulu- ja Unelmakorpuksen tehtävänannossa ei viitata tekstityyppiin 
mutta otsikko on ohjannut kertovaan tekstiin, jossa tapahtumia kuva- 
taan kronologisesti aamusta iltaan. S1-S2-kirjoitelmissa ohjeistettiin kir- 
joittamaan satu tai tarina, mutta lopputulos ei ratkaisevasti eroa muista. 
Aineistosta muodostuu kehityksellisesti kuvaava kaari kertomusraken- 
teen tavoittelusta aina enemmän kuvailevaa ja erittelevää ainesta sisäl- 
tävään kerrontaan. Alakoulun yläluokilla kirjoitelmat alkavat tavoittaa 
kertomusrakenteen skeemaa (Pajunen 2012) ja kaikkein kehittyneim- 
mät yksittäiset kirjoittajat arvioivat samalla unelmapäivän käsitettä jo 
kuudennella luokalla. Aikuisista suurin osa ainakin jossain määrin 
erittelee tai kuvailee. Vastaavasti irrottaudutaan tapahtumia pinnallises- 
ti luettelevasta päiväskeemasta (aamulla heräsin — illalla menin nukku- 
maan). Petälän (2018) tutkimuksen mukaan keski-ikäiset kirjoittavat 
vastaavasta teemasta siten, että irtautuvat sekä tapahtumajärjestyksestä 
että kertomusrakenteesta. Teksti säilyy silti pääpiirteissään kertovana, 
vaikka evaluaation määrä nousee. Heinosen (2018) mukaan viisi ylei- 
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sintä aihetta kuudes- ja yhdeksäsluokkalaisilla sekä nuorilla aikuisilla on 
harrasteet, ravinto, skeemaa jäsentävät triviaalirutiinit, ystävät sekä hyö- 
dykkeet. Nuorimmat kertovat juhlista, ystävistä, lemmikeistä ja huippu- 
lomapäivistä; rahalle annetaan suuri merkitys. Vanhemmilla omaperäi- 
syys lisääntyy, mutta toisaalta painotetaan aika samansuuntaisesti ystä- 
vyyssuhteita ja arjen pienten tapahtumien onnea. Monet kirjoitelmista 
ovat koskettavia, monet hauskoja, monet surullisia. Jo peruskoululaisilla 
mutta ennen kaikkea nuorilla aikuisilla kirjoitelma on elämäntarinatyyp- 
pinen (vrt. Habermas & de Silveira 2008; McLean & Breen 2009): se 
päivä elämässä, minä jotain käänteentekevää, merkityksellistä tapahtui 
tai odotetaan tapahtuvan. Kyse voi olla häistä, hautajaisista, opiskele- 
maan pääsystä, lapsen syntymästä tai vaikkapa unelmien matkasta. On 
tyypillistä, että tämäntyyppisissä kirjoitelmissa omaelämäkerrallisuus 
iän myötä lisääntyy (ks. Pasupathai & Mansour 2006). 

Kirjoitelmien tekstityyppi on siis kertova ja kirjoitelmien tavoitemuoto 
on tyypillisesti kertomus tai omaelämäkerta. Kertomus on määritelmän 
mukaan tapahtumien representaatio ja tyypillisesti tapahtumat kerro- 
taan tapahtumajärjestyksessä. Kerrontaa sitoo sisäinen aikarakenne (ks. 
esimerkiksi Berman & Slobin 1994). Kirjoitelmissa suurimpia verbi- 
luokkia ovat odotuksenmukaisesti tapahtumia ja liikkeitä ilmaisevat ta- 
pahtuma- ja liikeverbit, ja suurin adverbiryhmä koostuu aikaa ilmaise- 
vista. Käännekohdat kuljettavat kertomusta eteenpäin. Alakoulussa 
kertomustavoitemuodon saavuttamista mitattiin kertomusskeema-ana- 
lyysillä (Pajunen 2012; Honko 2013) ja narratologisilla kriteereillä (Vesa- 
la 2012). Jos narratiivisuus määritellään hyvin tiukasti, suurin osa vielä 
3.-luokkalaisistakaan ei tuota kertomuksia. Noin 60 prosenttia kuudes- 
luokkalaisten kirjoitelmista on heikkoja tai vahvoja kertomuksia, mutta 
sana- tai lauseluetteloita tai muulla tavoin keskeneräisiä kirjoitelmia 
löytyy myös. 

Kertomuksissa kertovan tekstin oheen syntyy arvioivia ja kuvailevia 
osuuksia; tämä on selvä kehityksellinen piirre. Örnmarkin (2011) mu- 
kaan argumentoivassa tekstissä monen tekstityypin yhdistelmät ovat 
ennemmin heikon kirjoittajan ominaisuus: erityisesti tukeutuminen 
(minäkeskeiseen) kertovaan kieleen argumentoivan sijasta on heikkou- 
den signaali. Siten kehitykselliset tekstiominaisuudet näyttävät vaihte- 
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levan tekstityypeittäin. Esimerkiksi nuorilla aikuisilla yksinomaisesti 
kertova teksti vaikuttaa lapsekkaalta, koska lukija odottaa aikuiselta jo 
perusteltuja siitä, miksi jokin asia on tärkeä, tai edes tärkeyden kuvaile- 
malla näyttämistä. Aineiston arvioivat kirjoitelmat, joissa ei ole lainkaan 
muiden tekstityyppien ominaisuuksia, rajoittuvat pariin tekstiin. Jos 
kirjoitelma keskittyy arviointiin, arvioinnin kohteeksi näyttää nousevan 
unelma, ei unelmien päivä. Kertova teksti on myös moniäänistä ja moni- 
äänisyys lisääntyy kehityksellisesti, samoin lukijan huomioiminen ja 
vuorovaikutuksellisuus. Kertovalla tekstillä on toisin sanoen oikeastaan 
aika moninaisia ominaisuuksia, jotka saadaan hallintaan hitaan kehityk- 
sellisesti. Onnistunut kertova teksti on siten vaativa kirjoitustehtävä, 
vaikka se usein mielletään koulunkäynnin alkutaipaleille kuuluvaksi. 

Alakoululaisia käsittelevissä luvuissa aineistona on joko Koulukorpus 
tai S1-S2-korpus. Yläkoululaisia ja nuoria aikuisia analysoidaan sekä 
Koulukorpuksen että Unelmakorpuksen aineistolla, mutta rakenteelli- 
nen kompleksisuus on tarkimmin koodattu Unelmakorpukseen. Osaksi 
käytössä on ainakin paikoin koko aineistoa, osaksi on tehty rajauksia. 
Norminmukaisuutta on arvioitu S1-S2-korpuksesta, jonka 650 kirjoitta- 
jalta on kerätty tietoa sekä eriaikaisesti että kyselytestein. 


KOEHENKILÖT 

Koehenkilöt ovat joko yleisopetuksen peruskoululaisia tai nuoria aikui- 
sia. Peruskoululaiset edustavat tasaisesti koko ikäluokkaansa — lukuun 
ottamatta kahden kieliluokan oppilaita — mutta mukana ei ole erityis- 
luokkien oppilaita. Aikuisilla on lähes kaikilla ylioppilastausta. S2-oppi- 
laita on kerätty edustavasti vain osaan aineistoa. Kaikki suomi toisena 
kielenä -oppilaat ovat Suomessa syntyneitä tai ennen esikouluikää Suo- 


8 Kolmasluokkalaiset kieliluokan oppilaat on valittu kielellistä ja matemaattista älykkyyttä mittaavan 
testin avulla peruskoulun 2. luokan keväällä. Nämä oppilaat kuuluvat monen muuttujan suhteen ylä- 
kvartiiliin ja ero valikoimattomaan kolmannen luokan aineistoon on keskimäärin 1,5—2 kehitysvuotta. 
Sekä ala- että yläkoulun aineistossa on yksi kieliluokka, alakoulun aineistossa on lisäksi kielikylpyluok- 
kia. Alakoulun kieliluokasta Helsingin Sanomien antamien tietojen mukaan 60 % kirjoitti äidinkielestä 
laudaturin. Luokan kielellinen taso jo alakoulussa tietysti osoittaa, että kyse ei ole yksin koulun vaiku- 
tuksesta (ks. myös Harjunen ja muut 2019). Hyvä osaamistaso ei kuitenkaan rajoitu kielikouluihin, 
vaan aineistossa on esimerkiksi eräs 6. luokka, joka suoriutui myöhemmin ylioppilaskirjoituksista 
lehtitietojen mukaan erinomaisesti. Vastaava osaaminen käy ilmi omasta tutkimuksestamme. 
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meen muuttaneiden maahanmuuttajataustaisten vanhempien lapsia, 
jotka ovat tutkimuksen alkuvaiheessa asuneet Suomessa vähintään 
noin 4 vuotta ja sen loppuvaiheessa vähintään noin 7 vuotta (Honko 
2013, d)-aineisto). Koehenkilöiden kokonaismäärää on vaikea laskea 
tarkkaan, mutta heitä on vähintään 2 Goo. Luku nousee, jos mukaan las- 
ketaan hankkeen opiskelijatöihin erikseen kerätty aineisto. Testeihin on 
osallistunut noin 1400 koehenkilöä; ja Unelmakirjoitelmia on yhteensä 
runsas 2 400. Osa koehenkilöistä on osallistunut vain yhteen tehtävään, 
osa moneen. Sähköisistä korpuksista koehenkilöiden määrää ei voi arvioi- 
da, mutta koska mukana on useita sanomalehtiä, kirjailijoita ja ylioppi- 
laskokeeseen osallistuneita, määrä on vähintään sadoissa. Sähköisten 
korpusaineistojen tuottajien ikä vaihtelee, mutta kyse on työikäisistä 
ihmisistä tai nuorista aikuisista. 

Peruskoululaisten aineistot on kerätty eri puolilta Suomea, mutta ke- 
ruu painottuu eteläiseen ja läntiseen Suomeen. Kouluja on mukana ke- 
ruussa yli 20 ja luokkia kymmeniä, mikä nostaa aineiston edustavuutta. 
Peruskoulun aineistossa on mukana kaikentasoisia koehenkilöitä, ja 
heitä ei ole esikarsittu esimerkiksi (lievän) kielihäiriön perusteella.? Otos 
edustaa siten koko yleisopetuksessa mukana olevaa suomenkielistä ikä- 
luokkaa, samoin tulokset. Yleisopetuksen luokkien taso vaihtelee melko 
sattumanvaraisesti. Suorituksista ei voi aina päätellä, johtuvatko niiden 
puutteet ulkoisen motivaation, pystyvyysuskon tai osaamisen puutteesta 
vai onko kyse kielihäiriöstä. Vaikka esimerkiksi suomalaiskoululaisten 
lukutaito on aikaisempien kansainvälisten PIRLS- ja PISA-kielitaito- 
kartoitusten perusteella huippuluokkaa, lukumotivaatio ja lukemiseen 
sitoutuminen ovat joillakin mittareilla mitattuna vertailumaiden hei- 
koimpia (KTL 2017; Leino ja muut 2019). Poikien suhtautuminen sekä 
lukemiseen että kirjoittamiseen ja omiin tekstitaitoihin on tyttöjä kiel- 
teisempää (Harjunen & Rautopuro 2015; Leino ja muut 2019). 

Asennetekijöiden merkitys oppimiseen voi olla suuri sekä suoraan 
että välillisesti: on vaikea syventyä asioihin, jotka eivät tunnu merkityk- 


9 Karsinta ei olisi ollut mahdollistakaan, koska lieviä häiriöitä ei aina diagnosoida (vrt. Kuusela 2011). 
Lievät kielihäiriöt näkyvät tutkimuksen aineistossa muun muassa kirjoitusvirhetyyppien perus- 
teella sekä toisaalta leksikaalisissa testeissä sattumanvaraisena vastaustapana (ks. Ahvenainen & 
Holopainen 2000; Kulju & Mäkinen 2009; Lehtinen 2014; vrt. Honko, tässä teoksessa). 
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sellisiltä, ja oppia sitä, millä ei ole yksilöllistä merkitystä tai minkä oppi- 
minen ei tunnu mahdolliselta. Jos äidinkielen kouluopetus ja käytetyt 
materiaalit ovat erityisesti poikien näkökulmasta omaan elämänpiiriin 
ja tavoitteisiin nähden etäisiä (Sulkunen & Kauppinen 2018), koulu ei 
pysty myöskään parhaalla mahdollisella tavalla tukemaan positiivisten 
asenteiden tai henkilökohtaisen suhteen syntymistä opittaviin sisältöi- 
hin. Ulkoisen motivaation puute näkyy erityisesti haluttomuutena yli- 
päätään tarttua kirjoittamistehtävään mutta kietoutuu luonnollisesti 
myös osaamiseen, koska kirjoittamistaito ei kehity ilman harjoittelua. 
Motivaatiota pyrittiin nostamaan paitsi pienillä palkkioilla myös testien 
vaihtelevilla toteuttamistavoilla. Osaksi tässä onnistuttiin, ja erityisesti 
sähköiset testit kiinnostivat. Toisaalta kokeen toteuttajat raportoivat häi- 
riökäyttäytymisestä myös sähköisissä testeissä. 

Peruskoululaisia tarkastellaan osaksi luokkakohtaisesti jakaumalla 
1.-9. luokkaan. Osaksi keskitytään peruskoulun päättövaiheisiin eli ala- 
koulun kuudenteen ja yläkoulun yhdeksänteen luokkaan, ja tällöin aja- 
tus on tutkia peruskoululaisia muutosvaiheessa. Lisäksi tutkimuksen 
ensimmäisiä tavoitteita oli tutkia juuri kuudesluokkalaisia, jotta saatai- 
siin tietoa yläkoulun alkuun eli vaiheeseen, josta aineenopettajat aloitta- 
vat. Monissa osatutkimuksissa aineisto on valittu kahden luokkavuoden 
välein. Tämä siksi, että yhden ja saman ikäluokan sisällä kielellinen ke- 
hitysero voi olla jopa parisen vuotta, jolloin seurauksena on, että ikä- 
luokkakehitys peittyy liian tiheällä koehenkilövalinnalla. Aineistossa 
on yleistä, että kolmannen ja neljännen, viidennen ja kuudennen sekä 
seitsemännen ja kahdeksannen luokan välillä muuttujissa on jonkin- 
laista häiriövaihtelua. Ero saattaa olla yhteydessä paitsi yksilölliseen 
kehitykseen myös murrosikään ja siihen liittyviin muutoksiin kirjoitta- 
mismotivaatiossa, keskittymiskyvyssä tai tehtäväorientaatiossa. Vuosien 
2013—2014 keruisiin osallistuneiden motivaatiota pyrittiin nostamaan 
arpomalla luokittain pari elokuvalippua osallistumispalkkioksi. Tulosten 
perusteella näyttää siltä, että arviointitilanteessa motivaatioon voidaan 
vaikuttaa palkkioin vain hyvin rajallisesti. Palkkio nostaa vastaamisha- 
lukkuutta mutta ei niinkään vastaamisen laatua. Syvemmälle juurtuneet 
negatiiviset asenteet esimerkiksi oppiainetta, tekstitaitoja tai omaa osaa- 
mista kohtaan jäävät tämän vaikutuksen tavoittamattomiin, eikä palkkio 
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luonnollisestikaan voi testitilanteessa tasoittaa aikaisemmin syntyneitä 
taitoeroja. 

Aikuisten testi- ja kirjoitelma-aineisto on kerätty ensin kolmessa 
Etelä-Suomen kaupungissa vuosina 2012, 2013 ja 2014. Nämä koehenki- 
löt eivät kaikki asu kyseisissä kaupungeissa vaan tulevat ympäri Suomea. 
Osa on ammattikorkeakouluopiskelijoita, osa on osallistunut suomen 
kielen pääsykokeeseen. Myöhempiin testeihin ja kielentämistehtäviin 
osallistuneet aikuiset on rekrytoitu pääosin korkeakouluopiskelijoista tai 
korkeakouluun pyrkijöistä, mutta jonkin verran mukana on myös mui- 
ta vapaaehtoisia. Koehenkilöistä ammattikorkeakoululaisille maksettiin 
pieni osallistumispalkkio. Myös aikuisaineistossa taso vaihtelee, mutta 
otos ei edusta koko nuorten aikuisten ikäluokkaa, koska koehenkilöt ovat 
pääosin suorittaneet ylioppilastutkinnon ja he ovat vapaaehtoisia. Pääsy- 
koeryhmä on nuorten aikuisten ryhmistä monimuotoisin, koska ryhmä 
ei keruun hetkellä koostunut korkeakouluopiskelijoista. Pääsykokeeseen 
osallistuneista kymmenisen prosenttia läpäisi pääsykokeen, muiden 
osalta ei ole tietoa myöhemmistä valinnoista. Ammattikorkeakoululaiset 
edustavat hyvin monia eri koulutusaloja humanistisista aloista terveyden- 
hoitoon ja tekniikkaan, mikä lisännee tulosten edustavuutta. 

Yksittäisten testien koehenkilömäärät ovat vaihdelleet 20-600. 
Ryhmäkohtaisesti on yleensä pyritty 100 koehenkilöön. Peruskoulun 
kuudennen ja yhdeksännen luokan joukko, joka osallistui neljän testin 
sarjaan, käsitti yli 150 oppilasta. Yksi testeistä oli kirjoitettava kielen- 
tämistehtävä. S1- ja S2-koehenkilöiden kielitietotesteihin osallistui noin 
650 alakouluikäistä, heistä 550 kirjoitti myös Unelmakirjoitelman. 
Lisäksi aineistossa on noin 50 kirjoitelmaa muilta samojen luokkien 
oppilailta. Sähköisiin semanttisiin ja morfologisiin testeihin osallistui 
yhteensä 300 koehenkilöä. He jakautuivat kuudes- ja yhdeksäsluokkalai- 
siin sekä nuoriin aikuisiin. Myös nämä koehenkilöt kirjoittivat Unelma- 
kirjoitelman. Osa-aineistot pääsykoeaineistoa lukuun ottamatta sisältä- 
vät suunnilleen saman verran mies- ja naiskirjoittajia. 

Tutkimukseen on hankittu tarvittavat luvat, jotka pyydettiin yksittäin 
usealta eri taholta. Alle 15-vuotiaiden vanhemmilta on pyydetty lupa 
lasten osallistumiseen, ja kaikkien koululaisten osalta on pyydetty lupa 
alueviranomaisilta, koulujen rehtoreilta ja luokkien opettajilta. Jokainen 
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koululainen on osallistunut oppitunnilla tehtyyn testiin muiden tavoin, 
mutta hän on voinut kieltää aineistonsa käytön merkitsemällä kiellon 
koepaperiin. Kieltäytyjiä oli muutamia ja heidän aineistoaan ei ole sisäl- 
lytetty tutkimukseen, vaan se on hävitetty. Aikuisten tuottamien aineis- 
tojen keruuseen on pyydetty suostumus paitsi koehenkilöiltä itseltään 
myös kouluviranomaisilta, alueviranomaisilta ja koulujen rehtoreilta, jos 
keruu on toteutettu koulun tiloissa. 

Koehenkilöiltä on pyydetty paperitesteihin nimi. Osa testeistä on 
toteutettu sähköisesti, ja tällöin testiohjelma on antanut koehenkilölle 
yksilöllisen nimikoodin, jonka avaimella testauksen eri osat pystyttiin 
yhdistämään. Koehenkilöiden nimiä ei ole liitetty aineistotietokantoihin 
eikä niitä ole säilytetty. Osa oppilaista on alkuaankin identifioinut itsen- 
sä vain etunimellä. Koulujen nimiä tai koulupaikkakuntia ei mainita 
tietokannoissa. Aineisto on myös muuten anonymisoitu. Kaikki henkilö- 
nimet on kirjoitelmiin muutettu mutta yleisimmät paikannimet, huvi- 
paikkojen nimet ja vastaavat ovat muuttamattomia, jos ne eivät viittaa 
koulujen sijaintikuntiin tai lähikuntiin. 

Aineiston keruun aikana vuoden 2015 tasa-arvolain uudistus, joka laa- 
jensi sukupuoleen kohdistuvan syrjinnän estämisen myös identiteetin 
ja sukupuolen ilmaisuun, ei ollut vielä voimassa. Koehenkilöt eivät siten 
voineet tehdä kyselyn sukupuolta koskeviin taustatietoihin mahdolli- 
sesti haluamiaan valintoja. Tämä ei ole sikäli ongelma, että keneltäkään 
koehenkilöltä ei kysytty tietoa sukupuolesta, vaan aineisto on jaoteltu 
myöhemmin etunimien perusteella nais- ja mieskoehenkilöiden tuotta- 
maksi, jotta väitettyjä kirjoittamistaitoeroja voidaan tutkia. Aineistoon ei 
osunut sukupuolineutraaleja nimiä, joten jaottelu ei tuonut ongelmia. 
S2-aineiston keruun yhteydessä oppilaan sukupuoli on koodattu oppi- 
laan tapaamisen tai ilmoitetun tiedon perusteella. Monet aikuiskirjoit- 
tajat pohtivat kirjoitelmassaan identiteettiään, mutta näitä pohdintoja 
ei käsitellä erikseen kuten ei muutenkaan kirjoitelmien yksityisempiä 
sisältöjä. Tutkimuksen alkuperäistä paperiaineistoa tai sähköisiä testejä 
ei ole säilytetty. Aineistosta kootut tietokannat ovat sen tutkijan hallussa, 
jolla niihin on tekijänoikeus. Vanhimpaan aineistoon ei ole keruun yh- 
teydessä pyydetty lupaa aineiston jatkokäyttöön, joten tämä osa aineis- 
tosta on jatkossakin yksityistä. 
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LUVUT 

Teoksen luvut jakautuvat kahteen temaattiseen osioon, joista ensimmäi- 
sessä lukujen analyysit lähtevät merkityksestä ja toisessa muodosta. Pe- 
rusteena on kielellisen eron lisäksi erilainen kielenhallinnan ja kielen- 
kehityksen kulku. Esittelemme lyhyesti teoksen sisältöä kyseisen kahtia- 
jaon ja itse lukujen argumentaation kannalta. 


MERKITYKSESTÄ MUOTOON JA MUODOSTA MERKITYKSEEN 
Teoksen luvut on jaettu kahteen temaattiseen osioon. Ensimmäisessä 
osiossa näkökulma ja analyysin lähtökohta on semanttinen. Kielenhal- 
lintaa käsitellään näissä luvuissa sen mukaan, miten peruskoululaiset 
ja nuoret aikuiset ilmaisevat sanamerkityksiä ja miten he kielentävät 
semanttis-pragmaattisia merkityksiä. Näitä merkityksiä luonnollisesti 
ilmaistaan muodoilla, mutta muodot saavat oikeutuksensa vasta merki- 
tyksien määrittelyn kautta. Luvut on järjestetty kehityksellisesti vaikeutu- 
vaan järjestykseen siten, että I osio alkaa sanamerkityksistä (Pajunen & 
Honko) ja laajenee sitten spatiaalisen merkityksen ilmaisuun (Tuuri) ja 
edelleen referentiaalisten viittauksien (Kouvo, Honko & Pajunen) ja mo- 
niäänisyyden ilmaisuun (Niinimäki). Sanamerkityksissä kehityksellinen 
linja kulkee asteikoilla yleisyys, konkreettisuus ja spesifisyys. Toisin sa- 
noen iän mukaan käytössä olevien sanojen määrä kasvaa ja niiden ylei- 
syys laskee, merkitykset muuttuvat abstraktimmiksi (samasta teemasta 
kirjoitettaessa) ja sanamerkitykset spesifisoituvat, niiden granulariteetti 
eli merkityksen täsmällisyys kasvaa. Nämä yleistykset koskevat myös 
spatiaalisen merkityksen ilmaisun hallintaa, mutta spatiaalisilla merki- 
tyksillä luodaan myös koherenssia ja ilmaisu laajenee sosiokulttuuriseen 
ja yksilöpsykologiseen suuntaan. Referentiaaliset ilmaukset lisääntyvät 
kertomuksellisuuden kehittyessä; vasta samojen diskurssireferenttien 
riittävän moni uudelleenmaininta lukijan kannalta identifioitavasti on 
(yksi) merkki kertomusrakenteen hallinnasta. Jos yksiäänisen diskurssin 
viittaussuhteiden ilmaisu on hallinnassa vasta alakoulun ylemmillä luo- 
killa, moniäänisen kerronnan kerrostuneiden viittaussuhteiden hallinta 
kehittyy vielä hitaammin. 

Semanttisten ilmiöiden kielentäminen edellyttää niiden semanttisen 
luonteen ja erilaisten funktioiden ymmärtämistä ja monien hierarkkis- 
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ten tai vaihtoehtoisten kielentamisen keinojen hallintaa. Niiden kielen- 
tämisessä kuvausta ei voi perustaa yhden ryhmän analyysien varaan, 
koska polku aikuisilmaisuun on niin mutkikas: usein ilmaisu, joka pie- 
nellä alakoululaisella on kehityksellinen saavutus, on yläkoululaisella 
heikko suoritus ja aikuiselta jo kadonnut. 

Toisessa osiossa lukujen näkökulma ja analyysin lähtökohta on kirjoi- 
telmien muodollisissa yksiköissä. Näillä muodoilla luonnollisesti ilmais- 
taan merkityksiä, mutta muotolähtökohta rajaa analyysin näkökulmaa 
esimerkiksi kompleksistumisasteikon mukaisesti. Kielenhallintaa käsi- 
tellään sen mukaan, miten lapset, nuoret ja nuoret aikuiset hallitsevat 
morfologisia ja syntaktisia muodollisia yksikköjä ja miten hallinta kehi- 
tyksellisesti muuttuu. Osio on järjestetty muotojen yksiselitteisyyden 
mukaiseen järjestykseen siten, että ensimmäinen luku (Laasanen & 
Pajunen) käsittelee muodollisesti hyvin yksiselitteisiä possessiivisuffik- 
seja ja pyrkii selvittämään paitsi käytön määrää, myös sen suhdetta pu- 
hutusta kielestä esitettyihin suffiksien katoamisennusteisiin. Toisessa 
luvussa (Honko) analysoidaan alakouluikäisten kirjoitelmien lähinnä 
sanatasolla esiintyviä normipoikkeamia, ja niiden iän mukaista vähene- 
mistä sekä vähenemisen suhdetta kielenhallintaan suomea toisena kiele- 
nään puhuvilla. Kolmas ja neljäs luku (Pajunen & Vainio) käsittelevät 
kompleksistumisasteikolla morfologisia ja syntaktisia yksikköjä — sana- 
rakennetta, sanaluokkajakaumiin perustuvia indeksejä sekä lauseraken- 
netta. Tavoitteena on selvittää, miten sanatasolla ja kertovan rakenteen 
tasolla mitattavat yksiköt hallitaan ja mitä muutosta niissä iän mukaan 
tapahtuu. Muotojen kompleksistuminen tarkoittaa käytännössä niillä 
ilmaistujen merkityksien tiiviimpää — ja abstraktimpaa — esittämistä. Tii- 
vistyminen puolestaan nostaa kertovan rakenteen globaalikoherenssia. 

Jos I osiossa kehitys on hyvin hidasta, II osiossa se on nopeampaa. 
Keskeinen ero on myös, että I osiossa analyysi on enemmän laadullista, 
II osion muotoja voidaan helpommin poimia ja mitata ja mittauksen 
avulla osoittaa ikäkausittaisia osaamisen mediaaneja, koska tiivistyvien 
muotojen hallinta näkyy kertovan tekstin samanlaistumisena toisin kuin 
merkitysten ilmaisujen hallinta, joka näkyy vaihtoehtojen monipuolis- 
tumisena. Ero johtuu jo yksinkertaisesti siitä, että muototasolla on yksik- 
köjä suhteellisen vähän, merkitystasolla niitä on paljon. Ajatus merkityk- 
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sen ja muodon epäsymmetriasta ei ole tietenkään uusi, mutta tässä se 
on pyritty esittämään täsmällisesti. 


LUKUJEN ABSTRAKTIT 


Myöhempi kielenkehitys: sanatiedosta rakenne- ja tekstitietoon 
Anneli Pajunen ja Mari Honko 


Johdantona toimiva ja tutkimusta taustoittava luku esittelee Myöhem- 
män kielenkehityksen tutkimushankkeen, jonka yhteydessä koko teos 
— sekä lukuisat opinnäytteet — on kirjoitettu. Pajunen ja Honko määrit- 
televät teoksen keskeisen käsitteistön, yhteiset tutkimuskysymykset, 
aineiston ja koehenkilöt, teoksen rakenteen ja yksittäisten lukujen tee- 
man. Teoksen keskeisenä teemana on suomen kielen hallinta lapsilla, 
nuorilla ja nuorilla aikuisilla ja sen kehityksellinen eteneminen perus- 
kouluikäisillä verrattuna nuoriin aikuisiin. Kielenhallinnan kehittymistä 
arvioidaan merkityksien kielentämisestä ikäkausittain ja toisaalta muo- 
tojen kielentämisestä. Merkitystason hallintaa tarkastellaan sanastotie- 
don ja semanttis-pragmaattisten ilmiöiden kielentämisen kannalta ja 
muotojen hallintaa morfologian ja syntaksin kautta. 


I Sanat ja merkitykset 

Osion I analyysiluvut vastaavat etenkin tutkimuskysymyksiin 1 (sanasto 
ja semanttinen tieto) ja 4 (kehityksellinen, kielellinen ja yksilöllinen va- 
riaatio). 


Unelmieni päivä -sanasto kehityksellisestä näkökulmasta 
Anneli Pajunen ja Mari Honko 


Pajunen ja Honko tarkastelevat Koulu- ja Unelmakorpuksen kirjoittajien 
käyttämää sanastoa laadullisesta ja määrällisestä näkökulmasta. Koehen- 


kilöiden ja kirjoitelmien määrä vaihtelee tarkastelussa vajaasta tuhannes- 
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ta lahes pariin tuhanteen. Tarkimmin on analysoitu niiden koehenkiléi- 
den kirjoitelmia, jotka osallistuivat myös semanttisen ja morfologisen 
prosessoinnin testaukseen. Sanatiedon osalta sukupuolierot eivät ole 
osoittautuneet kovin suuriksi, ja sukupuoli ei siksi ole kaikissa sanasto- 
analyyseissä mukana. Frekvenssilaskelmat osoittavat, että koululaiset 
käyttävät paljon kielen yleisintä sanastoa ja että ero on suurempi perus- 
koululaisten ja aikuisten välillä kuin peruskouluryhmien. Tämä voi joh- 
tua vahvasta koulukirjoittamisen konventiosta mutta heijastaa tietysti 
myös aikuisten laajempaa elämänpiiriä ja kokemusta. Diversiteettierot 
kasvavat aineistossa kehityksellisesti, eli käytetty sanasto monimuotois- 
tuu karttuvan iän ja kielenkäyttökokemuksen myötä. Sukupuolen mu- 
kainen ero on melko pieni — mikäli sitä ylipäätään voidaan testata — ja ai- 
kuisilla toisensuuntainen kuin peruskoululaisilla. Semanttinen analyysi 
osoittaa, että eri ikäluokat kirjoittavat samasta aiheesta ensisilmäyksellä 
samoilla aineksilla vaikka täsmällisemmin. Tarkempi analyysi osoittaa, 
että yleistasolla on jatkuva siirtymä konkreettisesta abstraktiin, joten 
elollisista ja konkreettisista elottomista kirjoittaminen vähenee iän mu- 
kaan, mutta että lisäksi abstraktistumiskehitys kulkee konkreettisiin tar- 
koitteisiin viittaavien ryhmässä siten, että peruskoululainen kirjoittaa 
tietyn luokan kuten syötävän aineen esiintymästä (karkki, limsa, sipsi, 
pizza), aikuinen enemmän itse luokan yleistasolla (ruoka, juoma, vesi). 
Semanttinen analyysi osoittaa kirjoitelmat myös selvän kertoviksi: tapah- 
tumaverbit ja ajan adverbit vallitsevat. 


Liiketilanteen väylän ja suunnan kielentäminen suomessa 
Emilia Tuuri 


Tuuri keskittyy spatiaalisuuden alaan kuuluvien liikkeen väylän ja suun- 
nan kielentämiseen nuorilla aikuisilla. Jos ryhmätason hajonta yleensä 
kehityksellisesti vähenee, yksilötason variaatio toisaalta kasvaa, ja se 
kasvaa erityisesti spatiaalisessa kontekstissa. Siinä vaikuttavia tekijöitä 
ovat tila ja liike, liikkeen rajattuus, kielentämisen resurssit, tapahtumien 
havaitsemiseen liittyvät tekijät ja lisäksi yksilölliset kielentämisstrategiat. 
Aineistona on videolle kuvattuja lyhyitä liiketapahtumia eli videostimu- 
luksia ja niiden kielentäjinä 50 nuorta aikuista. Väylä ja suunta eroavat 
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toisistaan juuri rajattuuden kannalta: väylän ilmauksissa liikeradalle 
ilmaistaan alkupiste (esimerkiksi ulos talosta), päätepiste (esimerkiksi 
sisään taloon) tai keskivaihe (esimerkiksi pellon poikki), joka rajaa muut- 
tujan liikkeen suhteessa kiintopisteeseen. Suunnan ilmauksissa (esimer- 
kiksi taloa kohti, poispäin) liikettä ei rajata kielellisesti. Luku keskittyy 
erityisesti väylän keskivaiheeseen ja suuntaan, jotka asettuvat monien 
videostimulusten kohdalla juuri rajattuuden kannalta vaihtoehtoisiksi 
tavoiksi jäsentää liiketilannetta: käveleekö poika sillan yli vai siltaa pit- 
kin, nouseeko nainen portaat vai portaita ylös? Koehenkilöt ilmaisevat 
videostimuluksissa näkyviä liiketilanteita joko melko yhdenmukaisesti 
tai hyvin varioiden, ja Tuuri analysoi myös tähän variaatioon liittyviä 
taustatekijöitä. Käy myös ilmi, että yhdeksäsluokkalaisilla on pääosin 
samat resurssit jo käytössään kuin nuorilla aikuisilla mutta kuudesluok- 
kalaisilla ei vielä ole. Kielitypologiselta kannalta Tuuri osoittaa, että suo- 
messa kielennetään väylää ja suuntaa rikkaasti moniin muihin kieliin 
verraten. On odotuksenmukaista, että tällainen moninaisuus kehittyy 
verrattain hitaasti. 


Referentiaaliset määräiset ilmaukset ja niiden suhde kertomus- 
rakenteeseen alakouluiässä 
Anna-Kaisa Kouvo, Mari Honko & Anneli Pajunen 


Kouvo, Honko ja Pajunen tarkastelevat kertovan tekstin koherenssin 
eli tekstuaalisen yhtenäisyyden syntyä. Luku keskittyy referentiaaliseen 
koherenssiin ja tutkii kertomuksellisuuden kehittymistä tarkastelemalla 
tarkoitteiden määräisyyden ilmaisemisen muutoksia alakouluikäisten 
teksteissä. Nuorimmat alakouluikäiset kirjoittavat atomistisia tekstejä, 
mikä näkyy muun muassa siten, että tekstiin tuodaan koko ajan uusia 
tarkoitteita, referenttejä, mutta niistä ei ole enempää sanottavaa. Iän 
myötä samoista tarkoitteista kerrotaan pidempään eli kerrotaan useam- 
mista toisiinsa linkittyvistä tapahtumista samojen henkilöiden tai asioi- 
den näkökulmasta. Samalla kun samoihin tarkoitteisiin viittaaminen 
lisääntyy, lisääntyvät myös keinot osoittaa kielellisin keinoin, että kyse 
on jo tekstiin esitellyistä tarkoitteista eli tutusta tiedosta. Yksijäseniset 
ilmaukset korvautuvat toisin sanoen erityyppisillä määritteillä tarkenne- 
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tuilla monijäsenisillä ilmauksilla. Luku osoittaa myös, että puhutun kie- 
len keinot ilmaista spesifisyyttä artikkelinomaisella se-pronominilla eivät 
kuulu alakouluikäisten kirjoitettuun kieleen. Jo nuorimmilla koululaisil- 
la on siis tässä suhteessa taito erottaa puhuttu ja kirjoitettu kielimuoto 
omassa kirjoittamisessaan, jos kirjoittaminen ylipäätään vielä onnistuu. 


Moniäänisyyden ilmaisun kehittyminen peruskoulun päättövaiheiden 
kirjoitelmissa 
Anneli Niinimäki 


Niinimäellä tarkastelun kohteena on moniäänisyyden tuottaminen kir- 
joitettuun kieleen. Moniäänisyys on semanttis-pragmaattisesti komplek- 
sinen ilmiö, jonka avulla ilmaistaan kerronnan kielellistä moniaineksi- 
suutta. Moniäänisyyttä on tekstiin rakennettu moninäkökulmaisuus ja 
tulkintojen vaihtoehtoisuus. Muutokset kertojan tai puhujan osallistuja- 
roolissa rakentavat moniäänisyyttä, samoin etääntyminen omasta ker- 
ronnasta ja viittaukset tekstin ulkopuolelle. Moniäänisyyden kielentä- 
mistä opitaan puhutussa kielessä melko varhain, mutta sen hallinta 
kirjoitetussa kielessä etenee hitaasti. Tämä prosessi voi olla kesken vielä 
peruskoulun päättövaiheissa. Kehitys suhteutuu kielellisen koherenssin 
luomiseen ja kertomusrakenteen tai yleensä tekstin rakentamisen oppi- 
miseen. Moniäänisyyden tyypeiksi on alakoululaisaineiston analyysin 
avulla määritelty intertekstuaalisuus, metakieliset viittaukset tapahtuma- 
kontekstin ulkopuolelle, suora ja epäsuora esitys sekä vapaa epäsuora 
esitys muunnelmineen. Varsinaisena aineistona on kuudes- ja yhdeksäs- 
luokkalaisten Unelmakirjoitelmia. Kouluikäisillä tarkastelun keskiöön 
nousee referointi, jonka kautta kirjoittajat tuovat kertovaan tekstiinsä 
toisen äänen. Kuudesluokkalaisilla referoinnin funktio on tyypillisesti 
kerrontaa eteenpäin vievä, ei pohdintaan liittyvä, kerronnan pysäyttävä. 
Yhdeksäsluokkalaisilla taas funktiona on episteeminen modaalisuus, 
minäkertojan ajatuksien ja tuntemuksien kuvaaminen. Samalla suoran 
esityksen määrä vähenee ja epäsuoran kasvaa. Toinen tyypillinen moni- 
äänisyyttä luova ilmiö on kertomuksen metatasoon kuuluva vuorovaiku- 
tuksen luominen lukijaan. Referoinnin taidoissa ja vuorovaikutuksen 
rakentamisessa on puutteita vielä peruskoulun päättövaiheessa. Osalla 
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kirjoittajista teksti kuudennella vuosiluokalla ja vielä peruskoulun päät- 
tövaiheessa on täysin yksiäänistä. Referoitua puhetta ei eroteta muusta 
kerronnasta, ja vuorovaikutuksen taidot puuttuvat. Toisaalta on myös 
joukko kirjoittajia, jotka osaavat lähestyä tarkoituksenmukaisesti lukijaa 
ja luoda kokemuksiinsa perustuvan kuvan omasta sisäisestä ajatusmaa- 
ilmastaan. 


II Muodot ja rakenteet 


Toisessa osiossa vastataan erityisesti tutkimuskysymyksiin 2 (muotojen 
hallinnan kehitys) ja 3 (sukupuolierot) ja osin 4 (kehityksellinen variaatio). 


Meneillään oleva kielenmuutos puhutusta kielestä kirjoitettuun ja 
suomen possessiivisuffiksi 
Mikko Laasanen & Anneli Pajunen 


Laasanen ja Pajunen tarkastelevat puhutun ja kirjoitetun kielen moda- 
liteettieroja ja toisaalta niiden samanlaisuutta ja erilaisuutta ja toteavat, 
että vaikka kirjoitetun kielen kehitys on alisteinen puhutulle myöhem- 
män kielenkehityksen alkuvaiheissa, myöhemmin suhde kehittyy vuoro- 
vaikutukselliseksi. Argumentaatio rakentuu erityisesti puhutun kielen 
perusteella meneillään olevan muutoksen — possessiivisuffiksien käytön 
vähenemisen ja mahdollisen kadon — varaan ja keskeinen tarkasteltava 
luvussa on, siirtyykö puhutussa kielessä meneillään oleva muutos suo- 
raan tai viipeellä kirjoitettuun kieleen. Keskeistä on siis, miten pitkälle 
kompleksisten ilmiöiden kielentämisen yhteydessä oleva kirjoitetun 
kielen muotoyksikkö saa vaikutuksia puhutusta kielestä. Tarkastelu ei 
luvussa ole kehityksellistä, jotta kehityksellinen vaihtelu ja muutos eivät 
sekoittuisi, vaan perustuu nuorten aikuisten eriaikaisiin kirjoitelmiin. 
Joitain kehityksellisiäkin havaintoja kyllä esitetään. Ajallinen ulottuvuus 
kattaa noin 70 vuotta 1940-luvulta 2000-luvulle. Vertailuaineistona on 
lehtikieltä, fiktiota ja oppikirjatekstejä. Possessiivisuffiksien käyttöä ar- 
vioidaan määrällisesti ja sanaluokkakohtaisesti. Lisäksi tarkastellaan suf- 
fiksien käyttöä niin sanottujen indeksisanojen eli eroavaa tai eroamaton- 
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ta omistusta ilmaisevien sanojen yhteydessä. Koska kyse on inherentisti 
tai juridisesti omistettavia objekteja ilmaisevista sanoista, voi olettaa, että 
possessiivisuffiksien käyttö juuri niiden yhteydessä olisi välttämättömin- 
tä ja vähäinen tai entistä vähäisempi käyttö ilmaisisi helposti muutok- 
sen. Tutkimus osoittaa, että kyseisenä ajanjaksona possessiivisuffiksien 
käytössä ei ole selvää ajallista muutosta, eikä käyttö myöskään aineiston 
eri osissa ole vähentynyt. Aineisto osoittaa sen sijaan kiistatta, että kir- 
joitetun kielen eri osa-aineistoissa possessiivissuffikseja käytetään eri 
määrin ja eri tavoin. Indeksisanoissa käyttö on yleisintä, muuten kyse 
on tekstilaji- ja tyyppieroista. 


Kirjoittamisen tarkkuuden kehittyminen ja yhteys kirjoittajan 
kokonaiskielitaitoon alakouluiässä 
Mari Honko 


Honko keskittyy tarkastelemaan norminmukaisen kirjoitetun kielen hal- 
tuunottoa eli kirjoittamisen tarkkuuden kehittymistä alakouluikäisillä 
koehenkilöillä ja vertaa suoriutumista kielenhallintaa mittaaviin testiar- 
voihin, todistusnumeroihin ja opettaja-arviointeihin. Koehenkilöinä on 
yhteensä 600 suomea äidinkielenä tai toisena kielenä puhuvaa. Kaikki 
suomea toisena kielenä puhuvat ovat Suomessa syntyneitä tai pitkään 
ennen kouluikää Suomessa asuneita. Hongon tutkimus on pitkittäistut- 
kimus, ja samoja koehenkilöitä on testattu kirjoituttamalla Unelmakir- 
joitus kahtena eri ajankohtana, ensin alakoulun alkuvaiheessa ja myö- 
hemmin loppuvaiheessa. Muuttujat ovat äänne- ja muotorakenteesta, 
mutta tarkastelussa on mukana myös sana- ja lausetason piirteitä. Äänne- 
tasolla kirjoittamisen kehittyminen edellyttää äänne-kirjainvastaavuu- 
den eli auditiivisen diskriminaation kehittymistä, toisin sanoen kykyä 
analysoida puhutun kielen yksiköitä. Alakouluikäisillä norminmukai- 
suus kehittyy selvästi sekä puhutun kielen että kirjoitetun kielen vaiku- 
tuksessa; kirjoittamisessa edellinen heikkenee iän myötä, jälkimmäinen 
voimistuu. Aineistosta kuitenkin nousee oletuksen vastaisesti pääosin 
pojista koostuva ryhmä, jonka tulokset viittaavat lieviin kielihäiriöihin, 
vaikka kielihäiriödiagnoosi puuttuu. Honko osoittaa, että norminmukai- 
suuden kehittyminen on sidoksissa kielenhallintaan. Norminmukaisuu- 
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den astetta voisi siten pitää alustavana kielenhallinnan kriteerinäkin, jos 
kirjoittamiskonteksti, tekstin luonne ja muut tekijät otetaan huomioon. 
Tulosten pohjalta voi myös arvella, että aina heikot kirjoittamistaidot 
eivät riipu pelkästään motivaation puutteesta. 


Kielen rakenteen hallinta peruskoululaisilla ja nuorilla aikuisilla 
Anneli Pajunen ja Seppo Vainio 


Pajunen ja Vainio keskittyvät teoksen kahdessa loppuluvussa kielenhal- 
linnan kehitystrendeihin, joita voi kuvata asteikolla yksinkertaisesta — eli 
puhutun kielen kaltaisesta — rakenteesta kompleksiseen rakenteeseen. 
Ensimmäisessä kuvaus etenee sanarakenteesta lauserakenteeseen ja 
osoittaa, että sanojen pidentyessä ja lauserakenteiden kompleksistuessa 
tekstit tiivistyvät. Samalla niiden rakennetta kuvaavissa indekseissä tulee 
näkyviin ikäkausikohtaisia tavanomaisen suoriutumistason mediaaneja, 
joiden avulla voi arvioida ikäluokkatasoista osaamista ja kielenhallin- 
taa. Nuorimmilla alakouluikäisillä osaamisen hajonta on hyvin suurta, 
mutta jo kuudesluokkalaisilla muuttujille on laskettavissa osaamisen 
tavanomaista tasoa ilmaisevia mediaaneja ja myös kehitys seuraavaan 
ikäluokkaan on ennustettavissa. Aineisto tosin osoittaa, että monissa 
muuttujissa alakvartiiliosuudet ovat normaalijakauman odotusarvoihin 
nähden liian suuret ja että monilla peruskoulun pojilla muuttujat si- 
joittuvat suoralle viivalle nousevan sijaan. Tämä on huolestuttava tulos, 
vaikka syitä ei saa aineistolla esiin. Kaikkiaan muotoon keskittyvät kirjan 
luvut osoittavat, että kielen hallinta etenee ikäluokasta toiseen melko 
tasaisesti paljastaen ikäkausiosaamisen keskitason. Puhutun kielen ra- 
kenne on pitkälti kehityksen lähtökohtana, mutta sen vaikutus ei ole 
kehitystä rajaava tekijä. Voi tosin arvella, että jos jo puhutun kielen hal- 
linnassa on ongelmia, ne heijastuvat myös kirjoitetun kielen hallintaan. 
Pajunen ja Vainio arvioivat kirjoitelmia muodollisten ja rakenteellisten 
mittarien avulla. 
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Syntaktista rakennetta tiivistavat ja kompleksistavat tekijat 
peruskoululaisilla ja nuorilla aikuisilla 
Anneli Pajunen ja Seppo Vainio 


Pajunen ja Vainio osoittivat edellisessä luvussa, että kirjoitetun kielen 
syntaktinen rakenne tiivistyy iän myötä. Nyt he erittelevät tarkemmin, 
mikä ominaisuus milloinkin vaikuttaa syntaktisen rakenteen komplek- 
sisuuteen, joka selvästi kasvaa ikäryhmittäin. Toisin sanottuna, mikä 
nostaa eri kompleksisuusmuuttujien arvoja ja mitä muodon hallinnan 
kannalta näistä ominaisuuksista voidaan päätellä. Sukupuolen mukaan 
arvioiden kompleksisuuserot ovat vähäisempiä kuin monet muut mää- 
rälliset erot. Keskeisin ero näyttää olevan se, että mieskirjoittajat tuotta- 
vat hieman kompleksisempaa tekstiä jo kuudennelta luokalta lähtien. 
Aikuisryhmässä erityisesti miehille ominaista on tiivistää kerrontaa lau- 
seenvastikkeita käyttäen. Kertova teksti on miehillä usein tiivistahtinen 
tapahtumasarja, jossa erityisesti temporaalirakenteilla taustoitetaan ja ta- 
kaistetaan tapahtumia. Myös naiskirjoittajilla on paljon tapahtumasarja- 
kirjoitelmia, mutta tekstin kulku on toinen. Jos sukupuolieroja mitataan 
sanamäärinä, erot ovat naisten hyväksi, mutta jos muotoeroja katsotaan 
tarkemmin, tilanne ei olekaan aivan yksinkertainen. Aineistosta nousee 
näkyviin myös yhdeksännen luokan poikien kirjoitelmia, joissa muuten 
nousevana linjana näkyvä kehitys on monen mittarin kautta mitattuna 
suoralla viivalla: arvot ovat usein samat kuin kuudennen luokan pojilla. 
Äkkipitäen näyttää, että mitään kehitystä ei olisi kielenhallinnassa tapah- 
tunut, mutta tämä ei voi olla koko totuus, koska elektronisissa testeissä 
tulokset ovat linjassa ikäluokkaan ja osin parempia kuin tytöillä. Ero voi 
liittyä myös ymmärtämisen ja tuottamisen väliseen eroon, sillä nämä 
kehittyvät eriaikaisesti. Motivaation puute on yksi taustatekijä, mutta se 
vaikuttaa usein enemmän tekstin koherenssiin kuin muotoyksiköihin. 
Väestötasolla täytyy tietysti huomata, että noin 2—3 prosentin alisuoriu- 
tuminen on odotuksenmukaista. 
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I 
Sanat ja merkitykset 


Sanatiedon hallinnan kehittyminen ja sanaston kasvu sekä erilaisten 
alati kompleksistuvien semanttis-pragmaattisten ilmiöiden kielentämi- 
nen on myöhemmän kielenkehityksen vaiheissa keskiössä. Sanatiedon 
hallinta on kehityksellistä ja sitä voidaan tutkia arvioimalla leksikon ko- 
koa ja sen käyttöä, mutta yhtä hyvin voidaan tarkastella, miten abstrak- 
timmalla tasolla olevia merkityksiä, kuten tekstimerkityksiä, kielenne- 
tään. 

Sanatasolla objekteilla ja tapahtumilla on sanamerkityksien kannalta 
katsoen muutamia vastineita, jotka ovat esimerkiksi hyponyymi-hypero- 
nyymisuhteisia tai toisensa synonyymeja tai antonyymejä. Yleistäminen 
ja spesifiointi lisäävät vaihtoehtoja, mutta silti kielellisiä resursseja on 
jossain määrin hallittavissa oleva määrä, kun nimetään objekteja ja yksit- 
täisiä tapahtumia. Tekstitasolla tilanne on monimutkaisempi, etenkin 
jos on kirjoittamalla kielennettävä ilmiöitä, joita ei puhutussa kielessä il- 
maista samalla tavoin tai samalla tarkkuudella ja tietoisesti. Tekstitasolla 
merkitysten kielentäminen edellyttää kirjoitettuun kielimuotoon hiljal- 
leen kasvamista. On ensinnäkin tiedostettava ja hahmotettava ilmiön 
luonne — kuten tekstin moniäänisyys tai koherenssi — ja ymmärrettävä, 
että se pitää kielentää tietyllä tavalla, jotta lukija ymmärtää tekstiä. Lisäk- 
si on tunnettava kielentämisessä käytettävissä olevat keinot ja hahmo- 
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tettava kulloisenkin tilanteen edellyttämät vaatimukset. Siten sanatasolla 
kehitys on — ainakin aluksi — nopeampaa kuin abstraktimmalla teksti- 
tasolla. 

Sanatiedon ja tekstitason merkitysten kielentämistä selvitetään I osios- 
sa neljästä näkökulmasta. Sanatiedon hallintaa käsitellään osion ensim- 
mäisessä luvussa. Seuraavissa luvuissa käsitellään tekstitason merkityk- 
sistä spatiaalisuuden ja referentiaalisen koherenssin ja moniäänisyyden 
ilmaisun kehittymistä sekä vaihtoehtoisten strategioiden että kielellisten 
resurssien kannalta. Sanatasolla voidaan osoittaa kehityksellisiä trende- 
jä, vaikka yksilön sanatiedon määrä aina vaihtelee. Tekstitasolla trendit 
ovat suhteellisempia, koska vaikka kielentämisen keinot monipuolistu- 
vat yksinkertaista moninaisempiin iän mukaan, samalla ilmiöiden vaih- 
toehtoiset kielentämistavat, näkökulmien moninaisuus ja vaikkapa kie- 
lenkäyttäjien kielentämiseen vaikuttavat yksilölliset havaintopsykologiset 
erot kasvavat. Hitaasti kehittyy myös kyky ymmärtää kirjoittajan ja luki- 
jan perspektiivien eroja ja deiktisiä ilmiöitä. Tekstitasolla yksilöllinen ja 
kielellinen variaatio ennemmin kasvaa kuin kanavoituu kehityksellisesti 
määriteltävään uomaansa. Analyysi lähtee I osiossa merkityksistä. 

Hankkeessa ei ole erikseen tutkittu luku- ja kirjoitustaidon tai yleensä 
äidinkielen opettamista. Jos tehdyn tutkimuksen perusteella kuitenkin 
voisi kiinnittää huomiota opettamiseen, on selvä, että erityisesti moni- 
mutkaisten tekstitason merkitysten kielentämiseen kannattaisi kiinnit- 
tää huomiota. Tekstimerkitysten kielentämisen oppiminen käy hitaasti, 
keinoja ei yleensä saada hallintaan vielä alakouluiässä eikä aina yläkoulu- 
iässäkään ja oppilaiden väliset erot kasvavat juuri tekstitason merkityk- 
sien kielentämisen hallinnassa. Tutkimukset myös osoittavat, että teksti- 
tasolla kielellisellä syötöksellä kuten luetun kuulemisella ja opetuksella 
on suuri merkitys. Opettaminen ei tosin ole helppoa, eikä tutkimus- 
tietoakaan ole tarpeeksi. 
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Johdanto 


Sanaston hyvä hallinta on lukuisissa tutkimuksissa osoitettu hyvän luku- 
ja kirjoitustaidon keskeiseksi taustatekijäksi (ks. esimerkiksi Carlisle 
2000; Oian 2002; Nippold 2006, 25—29, 89; Wagner, Muse & Tannen- 
baum 2007; Milton 2009, 170-192; Schmitt 2010, 3-12; suomen osalta 
Saarela 1997; Honko 2013; Kusnetsoff 2017). Hart ja Risley (1995, 2003) 
ovat osoittaneet, että Yhdysvalloissa heikko sanatieto päiväkoti-ikäisenä 
selittää heikosta lukutaidosta yhdeksänvuotiaana jopa 90 prosenttia. 
Nuorimpien osalta on myös tuloksia, joiden mukaan sanaston moni- 
muotoisuus ennustaa taitoa kirjoittaa kertomuksia (Olinghouse & 
Wilson 2013). Varhaislapsuudessa syntyneet erot sanastonhallinnassa 
voivat siis olla kauaskantoisia ja joko haitata tai edistää toiminnallisen 
kielitaidon kehittymistä. Suomesta vastaavat tutkimukset puuttuvat, 
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tosin äidinkielen arviointitutkimuksissa on joitain viitteitä heikon osaa- 
misen ja sanaston yhteydestä (ks. esimerkiksi Kuusela 2011).’° 

Aikaisemmin on havaittu, että kielen, sanaston ja peruskäsitteiden 
osaaminen kehittyy ikäluokkatasolla yläkoulun aikana lukemisen ja kir- 
joittamisen taitoa vähemmän ja joskus jopa taantuu (Harjunen & Rauto- 
puro 2015, 24—25). Nykyisissä opetussuunnitelman perusteissa tarkoitus 
on kuitenkin tukea oppilaita tarkastelemaan kieltä vuorovaikutuksessa ja 
myös sanastoa sen keskeisenä osana. Tekstien tulkinnan ja tuottamisen 
kuvauksen yhteydessä oppilaita kannustetaan erityisesti laajentamaan 
sana- ja käsitevarastoaan. Sanasto mainitaan erikseen kunkin ikätason 
äidinkielen ja kirjallisuuden oppimäärien kuvauksissa, ja sanasto on 
nimettynä sisältönä mukana myös opetussuunnitelman perusteiden 
erityisen tuen osiossa osana kommunikaatiotaitoja, joihin sanojen tun- 
nistaminen ja käyttökin kuuluvat (OPH 2014, 72). 

Kieli läpäisee kaikki oppiaineet, mutta erityisesti sanasto huomioidaan 
opetussuunnitelman perusteissa kielten oppimäärien kuvauksissa sekä 
suomen kielen ja kirjallisuuden kuvauksissa. Alkuopetuksessa koroste- 
taan sanojen havainnointia, sanojen ja sanontojen merkitysten sekä teks- 
tien sanavalintojen pohtimista ja oman käsitevarannon laajentamista. 
Vuosiluokilla 3.-6. rohkaistaan sana- ja käsitevarannon laajentamiseen 
sekä analyyttiseen tarkasteluun kuten ”selittämään, vertailemaan ja poh- 
timaan sanojen, niiden synonyymien, kielikuvien, sanontojen ja käsittei- 
den merkityksiä ja niiden hierarkioita” (mts. 162-164). Oman tuottami- 
sen yhteydessä mainitaan tekstien elävöittäminen ja sanavalintojen tar- 
kastelu osana tekstin merkityksiä. Vuosiluokilla 7.-9. oppilaita kannus- 
tetaan vakiinnuttamaan ja laajentamaan sana- ja käsitevarantoaan sekä 
pohtimaan kielellisten valintojen merkityksiä ja seurauksia. Erikseen 
kannustetaan sanastoon liittyvien rekisteri- ja tyylipiirteiden tutkimiseen 
sekä eri kielten sanaston vertailuun ja kuhunkin tekstiin sopivien ilmaisu- 


10 Hartin & Risleyn (1995) tutkimuksen mukaan lapsen leksikon koko on Yhdysvalloissa riippuvainen van- 
hempien sosioekonomisesta asemasta. Michaels (2013) kritisoi tätä väitettä jyrkästi. Hänen mukaansa 
tutkimuksen asetelma on rakennettu tulosta ennustavaksi eikä sana-aineistoa ole koodattu esimerkiksi 
kehitykselliseltä kannalta kriittistä abstraktisanastoa erotellen. Kolmas ja yhteiskunnalliselta kannalta 
vakavin kritiikin aihe on Michaelsin mukaan se, että huono koulusuoriutuminen langetetaan tutkimuk- 
sessa lasten ja heidän vanhempiensa syyksi. 
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tapojen valikointiin. (Mts. 291-291.) Valtakunnalliset opetussuunni- 
telman perusteet eivät kuitenkaan anna konkreettisia neuvoja siihen, 
millä tavalla sanatietoa tulisi opettaa tai tuottamisen ja tulkinnan taitoja 
harjoitella. Paikallisella opetussuunnitelmatyöllä, opettajien omalla val- 
veutuneisuudella ja aktiivisuudella sekä oppikirjantekijöillä onkin mer- 
kittävä rooli siinä, miten esimerkiksi sanamerkitysten havainnointiin 
ohjataan. 

Oma kokemuksemme opettajina ja opettajankouluttajina sekä aikai- 
sempi tutkimus antavat viitteitä siitä, että sanastoa käsitellään opetukses- 
sa usein yhä melko yksipuolisesti ja mekaanisesti niin, että painopiste 
on irrallisten sanojen nimeämisessä sekä luokittelussa. Kauppisen, 
Tarnasen ja Aallon (2014) tutkimuksen mukaan luokanopettajaopiskeli- 
jat eivät myöskään hahmota sanastoa osaksi äidinkielen opetuksen sekä 
reaaliaineiden opetuksen oppiaineintegraatiota, vaan yhteyksiä nähdään 
enemmän tekstilajituntemukseen ja jopa kielitiedon opettamiseen. Sil- 
loin, kun sanastoa ja sanatietoa opetuksessa tarkastellaan, huomio tun- 
tuu kiinnittyvän kykyyn nimetä ja luokitella sanoja annettujen katego- 
rioiden mukaan, ei itse prosessiin tai luokitteluperusteisiin kuten sano- 
jen käytön, merkityksen ja muodon analyyttiseen havainnointiin. Kogni- 
tiiviseen päättelyyn ja esimerkiksi luokitteluperusteiden kielentämiseen 
ohjaamisen kulttuuri tarvitsisi vahvistusta, jotta oppiminen — ajattelun ja 
kielellisten taitojen tukeminen — nousisi keskiöön kategorioiden läpi käy- 
misen sijaan. Oletus tuntuu olevan, että sanasto opitaan riittävän hyvin 
käyttöyhteyksistä ja erityisesti omaehtoisen lukemisharrastuksen avulla. 
Tämä näkyy paitsi oppimateriaaleista ja opetussuunnitelmista myös 
reaktioista: kun lukutaidon PISA-tulokset ovat laskeneet, ratkaisuksi on 
kehitelty tuettuja lukukampanjoita." Tutkimuksen valossa tämä on tär- 
keää mutta tuntuu riittämättömältä tilanteessa, jossa suomalaislasten ja 
nuorten lukemisaktiivisuus vähenee ja luku- ja kirjoitustaito heikkenee. 

Koulutuksen pitäisi tasata ja sen oletetaan tasaavan osaamistasoa 
(ks. esimerkiksi Hadley & Rispoli 2012), mutta oman tutkimuksemme 


11 Esimerkiksi Opetushallituksen Lukuliike ja siihen nidotut kampanjat koettavat lisätä lukemisharrastus- 
ta (ks. https://lukuliike.fi). Tavoite on hyvä, mutta ei välttämättä kohdistu siihen kasvavaan joukkoon, 
jonka ongelma on kielenhallinnassa tai ainakin kirjoitetun kielimuodon vieraudessa. 
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mukaan sanamerkityksen hallinnan taso, kyky analyyttisesti määritellä 
sanojen merkityksiä ja taito ymmärtää tai tuottaa johdoksia vaihtelee 
paljon myös ylioppilastutkinnon suorittaneilla nuorilla aikuisilla, joiden 
ikäluokastaan koulutetuimpina pitäisi omata melko yhtenevä taitotaso 
(ks. Pajunen, Itkonen & Vainio 2015; 2016; Vainio, Pajunen & Häikiö 
2019; Laasanen, Pajunen & Häikiö, arvioitavana). Sanaston hallinnan 
tutkimus on Suomessa ollut vähäistä, mutta kansainvälinen tutkimus 
on kasvavaa ja tiedetään, että vahvat sanastotaidot ovat yhteydessä paitsi 
hyviin tekstitaitoihin ja niiden edelleen kehittymiseen — myös hyvään 
koulumenestykseen ja opintopolulla etenemiseen (ks. esimerkiksi Hart 
& Risley 2003; Treffers-Daller & Milton 2013; Nation & Coxhead 2021). 
Sanaston hyvä hallinta on myös itseisarvo, joka säilyttää niin kulttuuria 
kuin edistää yksilön kykyä ilmaista itseään täsmällisesti ja osuvasti. 

Kartoitamme tässä yhteydessä koululaisten sanastotaitojen kehitty- 
mistä tutkimalla, miten eri-ikäisten kirjoittajien sanaston käyttö muut- 
tuu samasta aiheesta eli unelmien päivästä laadituissa Unelmakirjoitel- 
missa (alakouluikäisten unelmasanastosta tarkemmin ks. Laine-Leino- 
nen 2013). Ikäluokat ovat alakoululaiset ja yläkoululaiset, joita tarkastel- 
laan myös koululaisten ryhmänä, ja osaksi ryhminä ovat kolmas- ja 
kuudesluokkalaiset sekä yhdeksäsluokkalaiset. Vertailukohtana ovat 
nuoret aikuiset. Aineiston sanaesiintymien määrä on yli 200 000 ja ryh- 
mittäin korkeintaan 10 000 eri sanaa (lekseemiä). Oletus aiemman tut- 
kimuksen perusteella on, että käytetyn sanaston yleisyys laskee samalla, 
kun sanaston diversiteetti eli eri lekseemien määrä ja myös semanttinen 
monipuolisuus lisääntyy. Käsittelemme aineistoa ryhmätasolla, ja tavoit- 
teena on paitsi osoittaa sanaston monipuolistuminen myös luoda tie- 
toa ikäryhmittäisestä sanaston hallinnan keskimääräisestä tasosta. Jotta 
yksilöiden väliset erot eivät peittyisi, kuvaamme analyysien yhteydessä 
myös yksilöllistä vaihtelua. Käsittelemme ensin tutkimuksen teoreettis- 
ta taustaa ja keskeisiä käsitteitä sekä aineistoa, ja keskitymme sitten 
kirjoitelmasanaston yleisyyteen, diversiteettiin ja lopuksi semanttiseen 
luonteeseen. Loppulukuun kootaan tulokset. 
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Sanaston frekvenssitekijat, rikkausluvut 
sekä semanttinen luokitus 


Sanaston hallinnan tutkimuksessa tavoitteena on yleensä saada tietoa 
käytössä olevan sanaston yleisyydestä, sen moninaisuudesta ja semantti- 
sesta luonteesta. Yleisyyttä voidaan tarkastella lekseemi- ja esiintymä- 
tasolla sekä hyödyntämällä kattavuuslukuja, yleisyystasoja ja niin sanot- 
tuja perhefrekvenssejä. Näin voidaan tehdä ennusteita yleisimmin 
hallitun ja käytetyn sanaston luonteesta, sanojen oppimisiästä, proses- 
soinnin luonteesta ja niin edelleen. Puhutaan niin sanotuista frekvenssi- 
tekijöistä (ks. Bybee & Hopper 2001; Baayen 2014): yleisyys vaikuttaa 
suuresti siihen, minkälaiselle kielelle kielenkäyttäjät altistuvat ja on siksi 
yhteydessä myös sanaston tyypilliseen oppimisjärjestykseen (ks. esimer- 
kiksi Treffers-Daller & Milton 2013). Sanaston moninaisuutta teksteissä 
arvioidaan erilaisilla variaatio- ja rikkausluvuilla (ks. esimerkiksi Jarvis 
2013), ja semanttinen analyysi puolestaan edellyttää aineiston alaluoki- 
tusta ensin sanaluokkakohtaisesti ja edelleen merkityksen mukaan (ks. 
esimerkiksi Miller & Fellbaum 1991). 

Sanojen yleisyyden arviointiin tarvitaan massakorpus, jonka koon oli- 
si luotettavuuden vuoksi hyvä olla vähintään kymmenissä miljoonissa. 
Massakorpuksessa koko on yleensä tärkeämpi kuin sen koostumus, kos- 
ka mikään korpus ei ole harvinaisten sanojen osalta edustava ja koska 
yleisimmät sanat selviävät luotettavasti pienemmästäkin massakorpuk- 
sesta. Itse käytämme HS2000-korpusta (n. 24 milj. sanaesiintymää),'? 
jota täydennämme Tieteellisen laskennan antamin yleisyyksin (CSC kor- 
pus, 44 milj. sanaesiintymää). Korpusfrekvenssit annetaan yleisyytenä 
miljoonassa sanassa. 

Yleisyystasoja lasketaan jakamalla lekseemit yleisyyden mukaan tu- 
hannen siivuihin: Ensimmäinen tuhat sisältää kielen yleisimmät sanat. 
Yleensä riittää, jos erotellaan kymmenen yleisintä tasoa (ks. Laufer 
& Nation 1999, 39; Milton 2009, 22-43), ja tällöin harvinaiset sanat 
voidaan määritellä niiksi, jotka kuuluvat yleisyystasoille 9 tai sen yli ja 


12 HS2000-korpuksen kokonaissanamäärä on noin 31 miljoonaa; laskelmat perustuvat sana-ainesmerkki- 
määrään. 
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joiden esiintymiä miljoonassa sanassa on yksi tai vähemmän. Mita har- 
vinaisempi sana on, sen epätodennäköisempää myös on, että se osuu 
laskelmiin käytettävän korpuksen sanastoon. Siten harvinaiset sanat 
ovat myös niitä, joita ei korpuksista löydy. Koska harvinaisista sanoista 
on vaikea saada luotettavaa yleisyystietoa (vrt. esimerkiksi Keuleers, 
Stevens, Mandera & Brysbaert 2015), niiden tuttuus tietyssä ikäluokassa 
on parempi testata erikseen käyttämällä subjektiivisia testejä (vrt. Paju- 
nen & Itkonen 2019). Kehityksellisen tutkimuksen tarpeisiin riittää 
usein karkea yleisyystasojaottelu hyvin yleisestä tavalliseen ja harvinai- 
seen, koska aikuisenkin puhujan sanatieto alkaa nopeasti heiketä jo ylei- 
syystasoilla 9-10. 

Perhefrekvenssejä voidaan laskea suomen tapaisessa kielessä muun 
muassa tutkimalla sanueitten jäsenkokoa (kantasana ja sen johdokset 
ja yhdyssanat): mitä suurempi sanue, sen todennäköisemmin sana tun- 
netaan hyvin ja prosessoidaan nopeasti (ks. Pajunen, Vainio & Itkonen 
2015; Vainio, Pajunen & Häikiö 2019). Suomen kielessä substantiivi- 
perheet ovat paljon suurempia kuin verbiperheet, koska substantiivi- 
lekseemien ja verbilekseemien suhde on korkeintaan 8:2 ja koska 
substantiiveja muodostetaan myös yhdistämällä, verbejä vain harvoin. 
Substantiiviperhe on suuri, jos jäseniä on vähintään parisenkymmentä, 
mutta verbiperhe on suuri, jos niitä on vain muutamiakin. Perhefrek- 
vensseihin kuuluu myös niin sanottu taivutusperhefrekvenssi, joka 
saadaan yksinkertaisesti laskemalla massakorpuksesta sanan kaikki 
taivutusmuototyypit ja esiintymät tyypeittäin. Kaikki korpuksessa esiin- 
tyvät muodot, kuten kunkin substantiivisanan yksikkö ja monikko eri 
sijoissa tai liitepartikkeleissa taivutettuina, ovat laskennassa eri tyyppejä. 
Esimerkiksi hykerrellä-verbin taivutusperhekoko on HS2000-korpuk- 
sessa 8 ja yleisyys 21 (ks. taulukko 3). Nyt verbien taivutusperheet ovat 
paljon suurempia kuin substantiivien. Verbilekseemien toistuvuus on 
korkeampi kuin substantiivilekseemien, ja se nostaa eri konteksteissa ja 
siten useammissa eri taivutusmuodoissa esiintymistä. 

Taivutusperheluvut korreloivat melko hyvin esiintymäyleisyyteen 
korkeimpien lukujen osalta, mutta pienet taivutusperheet viittaavat 
sanan käytön vähäisyyteen tai rajoituksiin ja merkityksen vähittäiseen 
idiomaattisuuteen. Taivutusperhekoko vaihtelee yhdestä kahteen kol- 


66 ANNELI PAJUNEN JA MARI HONKO 


https://doi.org/10.21435/skst.1472 


meen sataan. Koko osoittaa, kuinka monipuolinen malli kielenkäyttäjäl- 
lä sanasta on. Iso taivutusperhe tukee esimerkiksi vartalonvaihteluiden 
hallintaa, pieni vastaavasti heikentää.” Kehityksellisestä näkökulmasta 
katsoen yleisen sanan vähäinen taivutus voisi viitata rajoittuneeseen 
käyttökontekstiin, mutta melko yleisen sanan maksimaalinen taivutus 
viittaisi monipuoliseen käyttökontekstiin. Jälkimmäinen tilanne edistää 
sanan opittavuutta. 


Taulukko 3. Esimerkki taivutusmuotoperheestä. 


Lekseemi Yleisyys Taivutusperhe Sanamuodon esiintymä Sanamuodon yleisyys 


hykerrellä 21 8 hykerrellen I 
hykerrellä 
hykertelee 


HNN 


hykertelemään 
hykerteleväksi 


Å 


l 
l 
hykertelevät 
hykerteli 

l 


N Bw 


hykertelivät 


Englannissa samaan perhefrekvenssiin lasketaan sekä sanue- eli deri- 
vaatioperhe että taivutus(muoto)perhe (ks. Bauer & Nation 1993). Vas- 
taava laskelma sisältäisi suomessa esimerkiksi paitsi kaikki käsi-sanan 
muodot myös sen johdokset ja kaikkien näiden johdosten kaikki eri tai- 
vutusmuototyypit. Tällainen perhefrekvenssi on suomesta mahdoton 
laskea, koska mikään ohjelma ei yhdistä kannan kaikkia johdoksia yh- 
teen — yhdyssanoista puhumattakaan — eikä laske lisäksi kaikkia niiden 
taivutusmuototyyppejä. Koska suomessa johtamattomien kantasanojen 
määrä on pieni ja johtaminen keskeinen sananmuodostuskeino, voi 
myös epäillä, olisiko tällaisista perheluvuista hyötyä. Nuorimmat koulu- 
ikäiset eivät myöskään vielä hallitse suomen sananmuodostuksen pe- 


13 Sanat keriminen, keritseminen ja kerkeäminen voivat muodosta riippuen saada kantasanakseen joko 
keriä tai keritä-muodon ja toisinaan jokin taivutusmuoto laukaisee myös kerjetä-verbin. HS2000- 
korpuksessa taivutusmuotoja on keritä-verbistä 10 (joista 1 liittyy keritsemiseen, 9 kerkeämiseen) 
ja keriä-verbillä 14 (joista esimerkiksi passiivimuoto voi liittyä sekä keritsemiseen että kerimiseen). 
Lampaan keritsemiskuvan kielennystehtävässä suurin osa koehenkilöinä toimineista nuorista aikuisis- 
ta nimesi kuvan kerimistapahtumaksi (Pajunen 2017). Toisin sanoen keritsemisen pieni taivutusperhe 
korpuksessa ennusti virhetulosta, vaikuttipa siihen mikä tahansa tekijä. 
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riaatteita vaan joko tuntevat tai eivät tunne yksittäisiä johdoksia näke- 
mättä samaan perheeseen kuuluvien johdosten välisiä yhteyksiä (ks. 
Kusnetsoff 2017). 

Laskemiseen liittyy synteettisessä kielessä monia periaatteellisia on- 
gelmia, joita toistaiseksi ei ole ratkaistu, vaikka hyviä laskemistyökaluja 
löytyisikin. Miten esimerkiksi määritellään sanueen lähtökohtana oleva 
(kanta)sana, tai miten otetaan produktiivisuus huomioon." Paras tunte- 
mamme väline taivutusmuotojen laskemiseen on WordMill (ks. Laine & 
Virtanen 1999), joka antaa tiedot suoraan hakutuloksena mutta määrit- 
telee kantasanan (tai lemman) paikoin epätoivottavasti (esimerkiksi sam- 
makoiden < *sammakoida). Ohjelma myös sisällyttää taivutusmuotoihin 
muutamia johdoksia, jotka halutessaan voi erotella vain manuaalisesti. 
Sanueiden kokoa joutuu toistaiseksi laskemaan sanakirjojen avulla. 
Synteettisestä kielestä saadaan myös sanarakennetta ja sanapituuksia 
arvioimalla kuva frekvenssitekijöistä ja sanaperheistä: johtamattomat 
sanat ovat yleensä johdoksia ja yhdyssanoja yleisempiä ja lyhyet sanat 
pitkiä yleisempiä. 

Käytämme sanaston kehittymisen tutkimuksen tukena yleisyyslukuja 
(/miljoona sanaesiintymää), yleisyystasotietoja ja taivutusperhefrekvens- 
sejä. Sanaperhelukuja emme käytä mutta niiden vaikutus peruskoulu- 
ikäisten kielenhallintaan tuli esiin hankkeen derivaatiotestissä (ks. Vai- 
nio ja muut 2019). Lisäksi tarkastelemme sanaston monimuotoisuutta 
(diversiteettitunnusluku sum of probabilities) sekä sen jakautumista si- 
sältö- ja kieliopillisiin sanoihin sekä eri sisältösanaluokkien sanoihin. 
Nämä tarkastelutavat mahdollistavat hyvin erilaajuisten sekä kokonais- 
rakenteeltaan että tyyliltään erilaisten tekstien vertailun, ja ne ovat pe- 
rusteltuja myös aikaisemman oppijankielen tutkimuksen perusteella. 
Varsinaisia oppimisikätietoja ei ole suomen kielestä kerätty. 

Analysoimme kirjoitelmien sanaston myös semanttisesti. Semantti- 
nen luokitus voi perustua yksin käsiteanalyysiin, jolloin ei tarvitse tehdä 


14 Hakulinen (1979, 478) toteaa sekä yksilön sanaston että murresanastojen kokoa arvioidessaan, 
että suomessa lukuihin on laskettava mukaan paitsi johtamaton sana myös jokainen johdos. 
Sanakirjoissahan hyvin produktiiviset johtimet, kuten teettokausatiivijohtimet ja minen-johdin/ 
muoto jätetään pääasiassa huomiotta. Kummankin oppiminen on kehityksellisesti mielenkiintoista. 
Lopputulema kuitenkin on, että derivaatioperheen laskeminen on suomessa erityisen vaikeaa. 
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jyrkkää sanaluokkaeroa. Käytännössä on helpompi lähteä leksikaalisista 
luokista, jotka perustuvat ontologis-semanttiseen kolmijakoon ‘oliot’, 
‘tapahtumat’ ja 'ominaisuudet”. Nämä luokat kattavat leksikaalisesta 
massasta valtaosan (91 % omassa aineistossamme) ja niiden jäsenet 
vaikuttavat siihen, millä täsmällisyydellä ja abstraktiuden tasolla maail- 
massa esiintyviä todellisia ja kuviteltuja olioita ja tapahtumia pystytään 
nimeämään. Ne myös ilmaisevat kulttuuris-yhteiskunnalliset sävyt ja 
tyylilliset erot, ja muun muassa frekvenssitekijöiden suhteen ne eroavat 
toisistaan selvästi. Peruskolmijakoa tarkastellaan alaluokittelemalla ne 
useihin merkityksen alaluokkiin. 

Myös syntaktiset, kielikohtaiset sanaluokat, kuten konjunktiot ja post- 
positiot, on koodattu aineistoon, mutta ne sivuutetaan tässä yhteydessä. 
Sanaluokkajako on luonnollisesti jatkumonluonteinen, on selvät sub- 
stantiivit, adjektiivit ja verbit ja sitten luokkien väliin jäävät erikoisryh- 
mät, kuten itsenäisesti käytettävät adjektiivit tai substantiivien luokasta 
irronneet adverbit, joten luokat jossain määrin risteävät. Verbi- ja adjek- 
tiiviluokituksissa voi tukeutua melko runsaaseen kirjallisuuteen, sen 
sijaan toimivia substantiiviluokituksia ei ole olemassa. Paras malli on 
ehkä Millerin (1998) käsitteellinen luokitus, joka listaa niin johtamatto- 
mat kuin johdetut substantiiviluokat. Sama malli on lukemattomissa eri 
kielten WordNet-sovelluksissa käytössä. Semanttinen analyysi on tehtävä 
manuaalisesti, mutta sen avulla saadaan tietoa sekä teemakeskeisestä sa- 
nastosta että kirjoitelmien sanaston abstraktiusasteesta. Yleisyystekijät, 
diversiteetti ja sanaston abstraktistuminen ovat sanatasolla keskeisiä 
kehityksellisiä muuttujia. 


Aineistona Unelmasanasto 


Unelmasanasto on koostettu Koulu- ja Unelmakorpuksen aineistoista, 
joissa on yhteensä lähes 1900 kirjoitelmaa ja noin 230 000 sanaesiin- 
tymää (ks. tarkemmin johdantoluvusta). Sana-analyysiä varten aineisto 
valikoitiin siten, että kaikki erikoisaines poistettiin, koska tavoitteena oli 
saada näkyviin leksikaalinen erilaisuus lekseemimäärän sijaan. Sana- 
esiintymät muutettiin lekseemeiksi noudattamalla seuraavia periaatteita: 
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1) Aineistosta poistettiin: 


a) proprit (henkilön- ja paikannimet sekä tavaranimet), sana- 
liitot, numerot ja merkit, 

b) epäselvyydet (ei analysoitavissa, rauniosanat tms.), 

c) vieraskieliset sanat sekä 

d) interjektiot ja numeroalkuiset sanat (9-v). 


2) Osa johdetuista sanaesiintymistä on laskettu edellisen derivaatio- 


vaiheen sanaan: 


a) Esimerkiksi minen-johdoksen esiintymät on laskettu vastaa- 
van verbin esiintymiin, mikäli se löytyy aineistosta. Jos verbiä 
ei ole aineistossa, minen-johdoksen esiintymä on luettu omaksi 
lekseemikseen. 

b) Kaikki partisiippien (aktiivin ja passiivin partisiipit sekä ma- 
partisiipit) esiintymät on laskettu vastaaviin verbilekseemeihin, 
mutta jos kyseinen verbilekseemi puuttuu aineistosta, partisiip- 
pi on oma lekseeminsä. 


Näillä kriteereillä esiintymämäärät vähenivät kokonaisesiintymämääris- 
tä kaikissa aineiston osissa muutaman prosenttiyksikön (ks. taulukko 4). 


Nuorimmilla vähennys johtui runsaista nimi- ja numeroesiintymistä, 
vanhimmilla oli paljon syntaktisia johdoksia. Vaikka esimerkiksi minen- 


johdokset lisääntyvät kehityksellisesti, niiden katsottiin ensi sijassa osoit- 
tavan syntaktista taitoa, jolla sanottavaansa saattaa tiivistää. Lekseemi- 


määrät taulukossa 4 ovat ryhmäkohtaisia, eli ne on laskettu ryhmittäin 


vain kerran, mutta eri ryhmissä samat lekseemit voivat toistua. 


Taulukko 4. Unelmasanaston frekvenssit. 

Ikäluokka Esiintymat — Esiintymät karsinnan jälkeen Ero % Lekseemit 
Alakoulu 1.-5. 64914 60860 6,2 4854 
Kuudennet 42282 39 422 6,8 4396 
Yläkoulu 36189 34209 55 4507 
Aikuiset 89192 87126 2,3 10 069 
Yhteensä 232577 221617 47 
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Leksikaalinen sana-aines on jatkoanalysoitu kolmella eri tavalla, jotta 
saadaan selville iän mukainen muutos ja kehitys sanaston käytössä. En- 
sinnäkin koko aineistolle laskettiin yleisyystiedot isoista sanomalehti- 
korpuksista (HS2000-korpus, ks. Pajunen & Virtanen 2002). Tulokset 
tarkistettiin sekä sanakohtaisesta (ks. Laine & Virtanen 1999) että kon- 
tekstia sisältävästä korpuksesta. Yleisyystiedot laskettiin sitten ryhmit- 
täin siten, että alakoulun 6. luokka laskettiin erikseen, koska siitä oli 
aineistoa paitsi vuodelta 2006 myös vuodelta 2014. Yläkoulun 7.-9. 
luokkien aineisto laskettiin pienuutensa vuoksi yhtenä ryhmänä. Aikuis- 
ryhmät analysoitiin erikseen, mutta erojen pienuuden vuoksi niitä käsi- 
tellään yhtenä. Toisekseen eri ikätasojen vertailua varten kolmannen, 
kuudennen ja yhdeksännen luokan peruskoululaisten sekä ammatti- 
korkeakoululaisten aineistosta tehtiin sanaston diversiteettilaskelmat 
koehenkilökohtaisesti (ks. taulukko 5). Kaikki tekstit, joissa sanamäärä 
oli pienempi kuin 42, poistettiin analyysistä, koska lyhyet tekstit vinout- 
tavat tuloksia ja koska käytetty diversiteettitunnusluvun menetelmä 
(sum of probabilities) edellyttää tiettyä vähimmäissanamäärää (McCarthy 
& Jarvis 2007, 472). Tässä menettelyssä tietyn tekstin sanastollista moni- 
muotoisuutta kuvataan tunnusluvulla, joka lasketaan kunkin tekstissä 
esiintyvän sanan esiintymistodennäköisyyksien summana. Laskennassa 
käytetään apuna etukäteen asetettua parametria (tässä tapauksessa 42), 
joka kuvaa todennäköisyyksien laskennassa käytettävän tekstikatkelman 
pituutta. Kolmanneksi koko ensimmäisen kohdan lekseemiaineisto ana- 
lysoitiin myös semanttisesti jakamalla aineisto ensin sanaluokkiin ja 
sitten luokittelemalla se sanaluokkakohtaisesti. 


Unelmasanaston yleisyys 


Frekvenssitekijät vaikuttavat sanaston hallintaan ja käyttöön voimakkaas- 
ti. Voidaankin ennustaa, että yleisin sanasto hallitsee nuorimpien perus- 
koululaisten kirjoittamista, mutta iän myötä sanasto harvinaistuu ja 
monipuolistuu. Tarkastelemme tässä yhteydessä niin sanottuja katta- 
vuuslukuja, lekseemien ja esiintymien yleisyyksiä, käytetyn sanaston 
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yleisyystasoja sekä taivutusperheitä ja suhteutamme eri frekvenssiteki- 
jöitä myös esimerkiksi sanojen rakenteeseen. 

Yleisyystiedot laskettiin HS2000-korpuksen avulla. Haut tehtiin sekä 
WordMill- että ContextMill-ohjelmilla. Ensimmäinen antaa tiedoksi 
sana- ja taivutusmuotofrekvenssit ja erittelee sanan kaikki ne esiintymä- 
muodot, mitkä lukuihin on sisällytetty, ja jälkimmäinen antaa sanojen 
käyttökontekstista halutulla tavalla rajatun tiedon. Esiintymämuotoihin 
sisältyvät muun muassa minen-johdokset ja eri funktioissa käytetyt par- 
tisiippimuodot. Saatuja frekvenssitietoja verrattiin Tieteellisen lasken- 
nan (CSC) antamiin yleisyyksiin. Frekvenssitiedot on siten koostettu 
yhteensä lähes 70 miljoonan sanaesiintymän aineistosta. Koska tiedot 
ovat peräisin sanomalehtikielestä, niiden perusteella saadaan luotettavaa 
tietoa suomen yleisestä sanastosta mutta ei aina tavoiteta arkikielen sa- 
nastoa: vaikka frekvenssilistojen kärki on tekstilajista riippumatta hyvin 
samankaltainen, ei asiatekstistä koostettuun frekvenssilistaan luonnol- 
lisesti juurikaan nouse puhutun kielen rekistereille tyypillistä sanastoa. 
Sellaisenaan tiedot eivät myöskään anna luotettavaa tietoa koko kielen 
harvinaisesta sanastosta. Tässä tutkimuksessa kuitenkin riittää, että saa- 
daan tehtyä ero yleisen ja harvinaisen välillä. 

Käsittelemme tuloksia luokittelemalla esiintymäyleisyyttä pääasiassa 
ryhmiin hyvin yleiset ja yleiset (yleisyystaso 1, yleisyystasot 2—4), tavalli- 
set (yleisyystasot 5-9) ja harvinaiset (yleisyystaso >10). Lisäksi on puut- 
tuvien joukko, johon kuuluvat ne, jotka eivät satu esiintymään HS2000- 
korpuksessa, ja ne, jotka eivät ole suomen vakiintuneita sanoja vaan 
esimerkiksi satunnaismuodosteita. Ikäryhmiä käsittelemme hieman 
eri tarkkuudella. Tarkin jako erottaa alakoulun luokat 1.-5. ja 6., ylä- 
koulun ja aikuiset. Monet erot näkyvät jo jaottelulla ala- ja yläkouluun, 
mutta kuudes luokka on analyysissämme ikään kuin siirtymätyyppiä. 
Koululaisten kirjoitelmissa kertovan tekstin luonne ja kerrontastrategia 
ovat melko samanlaisia etenkin aikuisteksteihin verrattuna, joten monet 
peruserot ovat osoitettavissa sanastotasolla jo vertaamalla koululaisia 
(melko hyviin) aikuiskirjoittajiin. 

Hieman yleistäen voidaan sanoa, että yleisimmät kielen lekseemit 
opitaan ensimmäiseksi, ja toisaalta, että yleisimmät lekseemit ovat moni- 
käyttöisyytensä vuoksi kommunikoinnissa ne hyödyllisimmät (ks. sanas- 
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m Alakoulu 1.-5. 
m Alakoulu 6. 


m Yläkoulu 


m Aikuiset 


1-10 100 1000 3000 4000 


Kaavio 2. Suomen kielen yleisimpien sanojen kattavuus kaikista sanaesiintymistä 
eri-ikäisten Unelmakirjoitelmissa: 10-4 000 yleisintä sanaa (= lekseemiä). 


ton yleisyyden ja toiston vaikutuksesta oppimiseen esimerkiksi Honko 
2013, 29-31). Lisäksi tarvitaan toki myös harvinaisempaa sanastoa, jonka 
osaamisen tarpeet ja siksi myös hyödyt määrittyvät tiiviimmin kielenkäy- 
tön yksilöllisten ja tilanteisten tarpeiden mukaan. Lekseemejä, joiden 
esiintymiä miljoonassa sanassa on tuhansia tai edes tuhat, on yleensä 
hyvin vähän; suomessa muun muassa olla ja ja ovat yleisyyskärjessä. 
Yleisimpien lekseemien merkitys on tärkeä myös tekstin kattavuus- 
lukujen kannalta. Kattavuus tarkoittaa sitä prosenttiosuutta, minkä tietty 
määrä lekseemien esiintymiä kattaa tekstin kokonaissanamassasta (ks. 
Laufer & Ravenhorst-Kalovski 2010). Miltonin (2009, 46) mukaan jo 
runsas kymmenkunta lekseemiä voi englannissa kattaa neljänneksen 
korpuksen sanaesiintymistä, sata noin puolet ja tuhat kolme neljännes- 
tä. Englanti on analyyttinen kieli, joten kattavuuteen vaikuttavat myös 
kieliopilliset sanat. Unelmasanastossa kymmenen yleisintä lekseemiä 
kattaa 20-30 prosenttia tekstimassasta, sata noin puolet ja tuhat yleisin- 
tä jo 80-90 prosenttia (ks. kaavio 2). Nuorimpien ja vanhimpien kirjoit- 
tajien välinen ero on yleisyysryhmittäin kymmenisen prosenttiyksikköä, 
ja kattavuus laskee lineaarisesti iän myötä. Yleisimpien sanojen osuus 
aikuisaineiston koko tekstimassasta muistuttaa englannin suhteita, 
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mutta tähän vaikuttaa myös tekstin luonne ja teeman yhteneväisyys. Mo- 
ninaisemmassa aineistossa peittävyys olisi suomessa englantia alempi, 
koska suomessa ei ole englannin tapaisia prepositioita eikä esimerkiksi 
artikkeleita. 

Kaikissa ikäryhmissä kymmenen yleisimmän lekseemin joukkoon 
kuuluvat ja, olla, se, minä ja päivä. Ne kuvastavat toisaalta tekstityyppiä 
ja toisaalta kirjoitelman aihetta. Sen sijaan muun muassa relatiiviprono- 
mini joka nousee yleisimpien listalle vasta kuudennella luokalla, jolloin 
puolestaan sanat sitten ja kun eivät enää esiinny listalla. Yleiskielessä 
yleinen ei taas ilmestyy listalle vasta kuudennen jälkeen; unelmista ei 
niinkään kirjoiteta kielteisessä mielessä. Kuudennella mennä-verbin rin- 
nalle ilmestyy lähteä-verbi, mutta aikuisten aineistossa yleisimpien sano- 
jen listalla ei enää ole verbien olla ja ei lisäksi muita verbejä. Yleisimpien 
lekseemien esiintymäjärjestys toisin sanoen tuntuu aika hyvin kuvaavan 
syntaksin taitojen kehittymistä: esimerkiksi relatiivilauseet lisääntyvät 
kehityksellisesti, kuten kirjan loppuluvusta käy ilmi. Nuorimmilla ylei- 
simmät kymmenen lekseemiä kattavat lähes kolmanneksen tekstimas- 
sasta, mikä osoittaa, että näiden lekseemien toistuvuus on erittäin kor- 
kea. Aikuisilla yleisimmät sanat ovat joko kieliopillisessa funktiossa 
käytettäviä konjunktioita, verbejä tai teemaan liittyviä (unelma, päivä). 

Kaikissa ikäryhmissä sadan yleisimmän lekseemin joukosta noin kol- 
mannes on verbejä. Tekstikattavuuden kannalta siirtymä yleisimmistä 
iän myötä harvinaisempiin käy jokseenkin lineaarisesti. Yleisyyslähteinä 
toimivien sanomalehtikorpusten sana-aineksista puuttuvat lekseemit 
ovat nuorimmilla sadunomaisia satunnaismuodosteita tai arkikielisiä 
(suklaatulivuori, älämölänpoistoaine, mörköpeli, porkkanaylläri, rentoilu), 
aikuisilla valtaosaan nousevat spesifiä merkitystä ilmaisevat satunnais- 
muodosteet tai tilanteiset yhdyssanamuodosteet (aamurapsutus, helikop- 
terinraato). Lisäksi kirjoitelmissa on joitain arkikielen sanoja (mussutella, 
pörräily) tai uudissanoja, joita 2000-luvun alun sanomalehdissä ei vielä 
esiintynyt (peukutus). 

Unelma-aineiston sanasto on luonnollisesti paitsi teemaan ja teksti- 
tyyppiin sidoksissa myös pieni: kussakin koululaisryhmässä eri leksee- 


15 Kirjoitelmien otsikointia (Unelmieni päivä) ei ole laskettu sanamassaan mukaan. 
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mien määrä jää alle 5 000:n (kokonaissanamäärä 34 209-60 860), vain 
aikuisaineistossa lekseemejä on enemmän. Siten sanasto ei kuvasta 
suomen yleiskielen yleisyyssuhteita riittävästi muiden kuin kaikkein 
yleisimpien sanojen osalta. Varsinainen yleisyystasoluokitus suomen 
kielestä vielä puuttuu. Lekseemien jakauma yleisyystasoihin on ryhmit- 
täin melko tasainen (ks. taulukko 5). Erot ovat suurimmat koululaisten 
ja aikuisten välillä. Koululaisilla kirjoitelmissa käytetyistä lekseemeistä 
on hyvin yleisiä (yleisyystaso 1) tai yleisiä (yleisyystasot 2-4) lähes 
30 prosenttia ja tavallisia (yleisyystasot 5-9) noin kuudennes. Koululais- 
ryhmissä yleisimpien määrä hieman kasvaa eikä laske iän mukaan, ku- 
ten odottaisi, mutta on mahdollista, että ero kuvastaa syntaksin taitojen 
kehitystä. Aikuisilla hyvin yleisiä tai yleisiä lekseemejä on selvästi vä- 
hemmän kuin koululaisilla eli noin viidennes. Harvinaisia lekseemejä 
on kaikilla määrällisesti paljon, vaikka esiintymiä harvinaisella leksee- 
millä on tyypillisesti vain yksi. Tässä koululaisten ja aikuisten ero on 
suurin eli yli kymmenen prosenttiyksikköä. Massakorpuksista eri syistä 
puuttuvia lekseemejä on kymmenisen prosenttia. Aineistossa on luon- 
nollisesti vähän suljettujen sanaluokkien jäseniä ja niiden joukossa on 
paljon hyvin yleisiä lekseemejä, avoimien luokkien tilanne on taas päin- 
vastainen. Harvinaisista lekseemeistä suurin osa kuuluu substantiivei- 
hin, verbeissä on enemmän toistuvasti käytettyjä, yleisiä lekseemejä. 
Käsittelemme sanaluokkien suhdetta yleisyyteen semanttisen analyysin 
yhteydessä tarkemmin. 


Taulukko 5. Unelmakirjoitelmasanaston jako yleisyystasoittain eri ikävaiheissa: eri yleisyys- 
luokkien lekseemien osuus kaikista eri lekseemeistä. 


Lekseemin yleisyys Alakoulu 1.5. Alakoulu 6. Yläkoulu Aikuiset 
/ Ikäluokka % 

Hyvin yleinen 12,2 13,8 14,2 7,2 
Yleinen 14,2 15,0 15,8 10,6 
Tavallinen 18,9 18,4 20,6 17,2 
Harvinainen 44,3 44,6 43,0 56,9 
Puuttuu korpuksesta 10,5 8,2 6,5 81 
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Unelmasanaston sanaesiintymistä kaksi kolmannesta kuuluu suomen 
tuhannen yleisimmän lekseemin joukkoon eli ne ovat hyvin yleisiä (ks. 
taulukko 6). Luku on peruskoululaisilla lähes 20 prosenttiyksikköä ma- 
talampi kuin kattavuuslaskelmissa (vrt. kaavio 2) ja tämä ero liittyy lek- 
seemien toisteisuuteen. Esiintymistä noin 15 prosenttia kuuluu yleiseen 
sanastoon (yleisyystasot 2-4), kymmenisen prosenttia tavalliseen (ylei- 
syystasot 5-9) tai harvinaiseen sanastoon. Peruskoululaisten välillä ylei- 
syyssuhteissa ei ole suuria eroja, mutta trendi on lievästi laskeva. Nuoret 
aikuiset eroavat selvemmin peruskoululaisista kuin nämä toisistaan. 


Taulukko 6. Unelmasanaesiintymien jako yleisyystasoittain. 


Sanaesiintymien yleisyys Koululaiset Aikuiset 
/ Ikäluokka % 

Hyvin yleiset 67,7 60,9 
Yleiset 14,3 15,9 
Tavalliset 8,2 10,0 
Harvinaiset 8,7 12,2 
Puuttuu korpuksesta 11 1,0 


Peruskoululaisilla sanasto on melko tavanomaista ja tuttua, ja ero aikui- 
siin on lekseemi- ja esiintymätasolla hyvin selvä. Eroa selittää ainakin 
osaksi se, että koululaisilla on vielä suuria puutteita sanastossaan. Perus- 
koululaisille tehdyssä tuttuustestissä, jossa aineistona oli 40 melko har- 
vinaista liikeverbiä, sanoista tunnettiin hyvin noin puolet (ks. kaavio 3). 
Loppuja tunnettiin heikosti tai ei ollenkaan. Esimerkiksi verbit kuhista, 
parveilla ja rämpiä olivat monille tuntemattomia. Aineisto on testattu 
myös nuorilla aikuisilla ja heillä tuntemus on ollut yli 90 prosenttia. 
Luetun ymmärtämisen kannalta katsotaan, että noin 95 prosenttia sana- 
esiintymistä pitäisi olla tuttuja, ennen kuin luettu oikeasti ymmärretään 
(Milton 2009, 52). Prosentti ei ehkä suoraan sovellu suomeen, jossa 
ymmärtämisongelmia voivat tuoda myös harvinaisemmat taivutus- ja 
etenkin johdinainekset sekä näiden käyttöön liittyvä morfofonologinen 
sanavartaloiden vaihtelu, mutta lienee silti viitteellinen. 
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Kaavio 3. Melko harvinaisten liikeverbien tuttuustesti kuudes- ja yhdeksäsluokka- 
laisilla (N = 157). 


Yleisyystasoluokitukseen heijastuu suomen tapaisessa kielessä myös 
lekseemien sanarakenne (ks. kaavio 4).'* Johtamattomien sanojen ylei- 
syystaso on keskimäärin matalampi kuin johdettujen ja johdettujen 
matalampi kuin yhdyssanojen. Kiteytymät eli lähinnä substantiivien tai 
adjektiivien paradigmasta irronneet sanat ovat tyypillisesti adverbeja, ja 
ne sijoittuvat alimpiin yleisyystasoluokkiin. Yhdyssanoissa mediaani on 
korkein. Yleisyystaso nousee kehityksellisesti jokaisessa sanarakenne- 
tyypissä eli sanasto harvinaistuu. Esimerkiksi johdetuista lekseemeistä 
keskeisin osa sijoittuu koululaisilla yleisyystasoille 3-10, aikuisilla ta- 
soille 4-10. Koululaisilla on enemmän vertailukorpuksesta puuttuvia 
yhdyssanoja, jotka aineistossa ovat satunnaismuodosteita. 


16 Niin sanotussa boxplot-kaaviossa pylvään keskiviiva ilmaisee keskimmäisen arvon eli mediaanin, 
leveä osuus sen ympärille sijoittuvat havainnot (yhteensä 50 % kaikista havainnoista) ja viivat ala- tai 
yläkvartiilin havainnot. Pallot ja tähdet viittaavat poikkeaviin havaintoihin. Kaaviossa 4 yleisyystaso 11 
ja 12 viittaavat korpuksesta puuttuviin sanoihin ja satunnaismuodosteihin, epäsanat on laskelmista 
poistettu. 
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Kaavio 4. Sanan yleisyystason ja sanarakenteen rippuvuus 1käluokittain. 


Taivutusperheiden ja yleisyystasojen ristiintaulukointi osoittaa, että ylei- 
syys ja taivutusmuotojen määrä korreloivat yleisimmissä lekseemeissä 
hyvin vahvasti (ks. kaavio 5): kaikki lekseemit, joille massakorpuksista 
löytyy yli sata eri taivutusmuotoa tai niiden kombinaatiota kuuluvat 
suomen yleisimpien lekseemien joukkoon. Tuhannen yleisimmän 
joukkoon kuuluvilla taivutusmuotoja voi olla kolmekin sataa, mutta 
mediaani on huomattavasti matalampi, noin 50. Suurin osa paljon taivu- 
tusmuotoja saaneista lekseemeistä on verbejä, ja yksittäisellä verbillä on 
sanomalehtitekstissä aina enemmän taivutusmuotoja kuin yksittäisellä 
substantiivilla toisteisuuserojen takia. Erosta voi päätellä, että verbisyn- 
taksin opetus voisi hyödyttää, jos kirjoittamistaitoja halutaan edistää. 
Monella koululaisella ongelma on lauseenmuodostuksessa, ja juuri ver- 
bit ovat lauseenmuodostuksen ydin. Eri verbimuodoilla tuotetaan paitsi 
leksikaaliset myös temporaaliset ja modaaliset merkitykset sekä muute- 
taan lauseen argumenttien asemaa. 
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Kaavio 5. Massakorpuksen taivutusperheet ja Unelmasanaston lekseemit yleisyys- 
tasojakauman mukaan ikäluokittain. 


Lehtikielessä lekseemien taivutusperheiden koko laskee yleisyystasoittain 
siten, että harvinaisempia taivutetaan vähemmän kuin yleisempiä. Nuo- 
rempien ja vanhempien unelmasanasto näyttää olevan hiukan erilaista 
taivutusperheiden suhteen, koska aikuisilla käytössä olevia sanoja taivu- 
tetaan lehtikielessä enemmän kuin niitä sanoja, joita koululaiset käyt- 
tävät (ks. kaavio 5). Ero näkyy monista yleisyysluokista ja syntyy pitkälti 
aikuisten melko abstraktimerkityksisistä ja pääosin johdetuista verbeistä. 
Yleisimmistä verbeistä voi esimerkkeinä mainita verbit käsitellä, korostaa, 
arvostaa, sallia ja poistaa ja harvinaisista muun muassa verbit sovitella, 
turhautua, kontrolloida, aloitella, puhutella; peruskoululaiset eivät näitä 
verbejä käytä lainkaan. Ero viittaa siihen, että aikuisten sanasto vastaa 
paremmin lehtikielen sanastoa kuin koululaisten, ja siihen, että aikuisilla 
sekä leksikaalinen että syntaktinen variaatio on suurempi kuin koululai- 
silla. Peruskoululaisten ryhmissä taivutusperheiden koko kasvaa iän mu- 
kaan tasaisesti ja osoittaa muutoksia sanastossa. Yläkoululaissanastossa 
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on muun muassa verbit arvioida, uudistaa, hävittää, lakkauttaa, miellyt- 
tää, teloittaa ja sulattaa, jotka kokonaan puuttuvat alakoululaisilta. 

Massakorpuksesta laskettujen taivutusperheiden koko ilmaisee myös 
sen, miten moninaisesti kielenkäyttäjät altistuvat tietylle lekseemille. 
Tällainen luku sopii käyttöpohjaisen kielenoppimisteorian (ks. esi- 
merkiksi Tomasello 2003; myös MacWhinney 2001, 464) mukaisiin 
näkemyksiin, vaikka ei kerrokaan koko totuutta siitä, mitä yksittäisiä 
sanoja eri yksilöt kohtaavat tai merkityksellistävät ja todennäköisimmin 
oppivat. Tulokset osoittavat selvästi, että Unelmasanastossa on eniten 
esiintymiä sanoista, joiden taivutus on massakorpuksissa moninaista. 
Vähemmän taivutettujen lekseemien esiintymät kasvavat kuitenkin li- 
neaarisesti. Leksikon ja sen käyttökontekstien jatkuva laajeneminen ja 
harvinaisempiin lekseemeihin ja muotoihin kehittyminen on vastoin 
radikaaleimpia — ja yksinkertaisimpia — frekvenssitekijöiden roolia ko- 
rostavia näkemyksiä, joiden mukaan ilmaukset automatisoituvat yli pe- 
rinteisten morfeemi- ja sanarajojen ja muuttuvat leksikaalisiksi kollo- 
kaatioiksi (vrt. esimerkiksi Bybee & Hopper 2001). Tällainen näkemys 
ei ylipäätään sovellu suomen tapaiseen taivutuskieleen. 


Unelmasanaston diversiteetti 


Sanaston diversiteettiä koskevaan tarkasteluun poimittiin otos eri-ikäis- 
ten aineistoa. Alkuvaiheessa otettiin mukaan kaikki kolmannen, kuu- 
dennen ja yhdeksännen vuosiluokan koululaisten sekä ammattikorkea- 
koululaisten kirjoitelmat eli yhteensä 729 tekstiä, joista 67 poistettiin 
seuraavassa vaiheessa liian lyhyinä (tekstin sanaesiintymiä oli alle 42). 
Lopullisen aineiston kokonaissanamäärä oli yhteensä 105 942 sanetta ja 
662 kirjoitelmaa (ks. taulukko 7). 

Unelmakirjoitelmien sanaston diversiteettiä on verrattu kirjoittajien 
ikään (kaaviot 6—7). Kaaviot on piirretty koko siitä aineistosta, josta käy- 
tetyn diversiteettitunnusluvun (sum of probabilities, SOP) laskeminen 
on mahdollista (kirjoitelman sanamäärä on vähintään 42).7 Käytetty 


17 Koska kaaviot on pyritty pitämään luettavassa muodossa, yksi yhdeksäsluokkalaisen kirjoitelman 
poikkeavan korkea arvo (lähes 50) jää näkymättömiin. 
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Taulukko 7. Unelma-aineiston määrä diversiteettilaskelmissa. 


Ikäluokka Kirjoitelmat Kirjoittajan sukupuoli Poistot Sanamäärä 
Kolmas 154 69 F, 85M 30 10 422 
Kuudes 323 160 F, 153 M 27 41 543 
Yhdeksäs 161 88 F, 72 M 10 24 983 
AMK 101 43 F, 58 M Fi 28 994 
40,00 
35,00 
a 
[e] 
O 30,00 
8 o 
2 o 
o 
25,00 * x 
20,00 
Kolmas Kuudes Yhdeksäs Aikuiset 


Kaavio 6. Kirjoittajan iän yhteys kirjoitelmien sanaston monimuotoisuuteen 
(SOP) ikäluokittain. 


mittaustapa on arvioitu tekstipituuden suhteen melko neutraaliksi ja si- 
ten turvalliseksi hyvinkin eripituisten tekstien arvioinnissa (McCarthy & 
Jarvis 2007, 460; ks. myös Malvern, Richards, Chipere & Durän 2009), 
mutta kaikkein lyhimmissä teksteissä yleisimmätkään sanat eivät ehdi 
toistua yhtä todennäköisesti kuin hieman pidemmissä. Tarkastellussa 
aineistossa sanaston keskimääräinen diversiteetti kasvaa lähes lineaari- 
sesti ikäluokasta seuraavaan (ks. kaavio 6). Samalla yksilöiden välinen 
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hajonta pienenee eli vanhimpien kirjoittajien ryhmissä yksittäisten kir- 
joitelmien sanaston diversiteetti on lähempänä ikäluokan keskimääräistä 
tasoa. Kehitys on selkeä ikäryhmien ylintä neljännestä lukuun ottamatta: 
vaikka sanastollisesti köyhiä kirjoitelmia esiintyy nuorimmilla kirjoitta- 
jilla selvästi enemmän kuin vanhemmilla kirjoittajilla, jo kaikkein nuo- 
rimpien aineistossa on myös sanastoltaan vaihtelevia tekstejä. Tätä selit- 
tää osittain leksikaalisten sidoskeinojen vähäinen käyttö ja nuorimpien 
koululaisten kirjoitelmien lyhyys, mutta osittain myös nuorimmilla on 
sanastollisesti moninaisia ja muutenkin tasokkaita kirjoitelmia. 
Sukupuolen ja sanaston diversiteetin yhteys ei ole yksiselitteinen, sil- 
lä vaikka peruskoululaisten kirjoitelmissa sanasto näyttää olevan vaihte- 
levampaa tyttöjen kuin poikien teksteissä (ks. myös Honko 2013), nuor- 
ten aikuisten kirjoitelmissa tilanne on päinvastainen (kaavio 7). Poikien 
ryhmissä yksilölliset erot sanaston diversiteetissa ovat hieman suurem- 


Sukupuoli 


Hr 
mm 


Kolmas Kuudes Yhdeksäs Aikuiset 


Kaavio 7. Kirjoittajan sukupuolen yhteys kirjoitelmien sanaston monimuotoisuu- 
teen (SOP) ikäluokittain. 
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mat kuin tyttöjen ryhmissä, mutta sekä pojilla että tytöillä yleistaso on 
muutamaa poikkeusta lukuun ottamatta jo peruskoulun yhdeksännellä 
luokalla vähintään kohtalaista tasoa (SOP >30, englannin kielestä Mc- 
Carthy & Jarvis 2007, 464). 

Samaan aikaan kun kirjoitelmien sanaston diversiteetti kirjoittajan 
iän mukaan lisääntyy, myös sanojen keskimääräinen pituus kasvaa. Mo- 
lempia piirteitä voidaan pitää kehityksellisinä siinä mielessä, että ryhmä- 
tasolla ne kuvaavat kehittyvää kieli- ja kirjoitustaitoa, joka tarkastellussa 
aineistossa on kiinteässä suhteessa kirjoittajan ikään. Myös tietyn ikä- 
luokan sisällä tekstipituuden ja sanaston diversiteetin välillä on tarkas- 
tellussa aineistossa löyhä yhteys: pisimmät kirjoitelmat ovat sanastol- 
taan moninaisempia hieman todennäköisemmin kuin lyhyet. Sanaston 
diversiteetti ei yksilötasolla kuitenkaan ole voimakkaasti riippuvainen 
tekstipituudesta, mikä on odotuksenmukaista myös aiemman tutkimuk- 
sen valossa (Honko 2013). Esimerkiksi yhdeksäsluokkalaisten kirjoitel- 
missa korrelatiivinen yhteys tekstipituuden ja sanastollisen diversiteetin 
välillä on heikko, eikä sitä voi pitää kirjoittamisen ennustettavuuden 
kannalta merkityksellisenä. Siitä huolimatta heikkokin (tilastollisesti 
merkitsevä) positiivinen yhteys vahvistaa näkemystä leksikaalisesta di- 
versiteetistä kehityksellisenä piirteenä. 

On huomionarvoista, että vanhempien kirjoittajien tekstit ovat paitsi 
sanastoltaan vaihtelevampia myös pisimpiä, vaikka tekstipituuden kas- 
vaessa korkean sanastollisen diversiteetin ylläpitäminen ja kasvattami- 
nen käy yhä haastavammaksi. Sanaston vaihtelevuuteen vaikuttaa luon- 
nollisesti myös aiheiden määrä. Heinosen (2018) mukaan kuudes- ja 
yhdeksäsluokkalaisten sekä ammattikorkeakoululaisten Unelmakirjoi- 
telmissa on käsittelyssä keskimäärin 3—4 aihetta, mutta kaikkein nuo- 
rimmilla aiheita on enemmän kuin aikuisilla. Yleisimmät aiheet ovat 
harrasteet, ravinto, ystävät ja hyödykkeet. Nuorimmat kirjoittavat mielel- 
lään perheestä ja kuuluisuudesta, vanhimmat urasta, arvoista ja parisuh- 
teesta. Kun aikuiset kirjoittavat pidempiä kirjoitelmia kuin kouluikäiset, 
he samalla käsittelevät harvempia aiheita mutta kutakin aihetta moni- 
puolisemmin. Toisin sanoen nuorimmilla sanaston monipuolisuus syn- 
tyy useammin pinnallisista luettelonomaisista kirjoitelmista, aikuisilla 
monipuolisesta saman aiheen käsittelystä. 
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Aineistosta on lisäksi laskettu leksikaalinen tiheys (sisältösanojen 
osuus sanamassassa) ja substantiivi-verbi-indeksi eli substantiivien 
osuus substantiivien ja verbien summasta (NTVR eli noun-to-verb ratio). 
Näiden lukujen on ajateltu kertovan tekstien informaatiotiheydestä ja tii- 
viydestä, ja niiden suhde sanastolliseen diversiteettiin on siksi kiinnos- 
tava. Leksikaalinen tiheys on Unelmakirjoitelmissa 75-80 prosenttia 
kokonaissanamäärästä ja nousee hieman iän myötä, kuten Pajunen 
ja Vainio tässä kirjassa osoittavat. Leksikaalisen tiheyden ja sanaston 
diversiteetin välinen yhteys koko tekstiaineistossa on heikko mutta 
positiivinen. Sanastoltaan vaihtelevissa kirjoitelmissa vaihtelu saavute- 
taan todennäköisimmin käyttämällä runsaasti avointen eli sisältösana- 
luokkien sanoja, ja kaikkein toisteisimmissa kirjoitelmissa puolestaan 
kieliopillisten sanojen osuus on hieman keskimääräistä suurempi. 
Mitä enemmän leksikaalinen tiheys jää alle kirjoitelmista laskettujen 
mediaaniarvojen, sitä varmemmin myös sanaston diversiteetti jää alle 
ikämediaanin. Tämä tulos sopii jo aiemmin esiin tulleeseen tendenssiin, 
jonka mukaan ikäryhmittäisissä mediaaneissa pyörivät arvot viittaavat 
ikäluokan osaamistasolla onnistuneeseen tekstiin. 

Substantiivi-verbi-indeksi on kirjoitelmissa ja oletettavasti kertovassa 
tekstissä ylipäätään keskimäärin 1,1:1 ja nousee iän mukaan muutaman 
prosenttiyksikön, tavanomainen vaihteluväli on Pajusen ja Vainion mu- 
kaan 50-57 prosenttia eli keskimäärin hieman enemmän substantiiveja 
kuin verbejä (ks. myös Biber, Conrad & Reppen 1998). Jos arvo on mata- 
la, teksti koostuu peruslauseista ja on lähellä puhutun kielen rakennetta, 
mutta jos arvo on korkea, teksti on rakenteeltaan kompleksista (paljon 
alisteisia verbirakenteita) ja/tai abstraktia (paljon substantiiveja). Siten 
oletus on, että substantiivi-verbi-mediaanissa olevissa kirjoitelmissa 
sanasto olisi melko vaihtelevaa. Toisaalta oletus myös on, että mitä kor- 
keampi substantiivi-verbi-indeksi on, sitä vaihtelevampaa sanasto on. 
Nämä oletukset näyttäisivät pitävän paikkansa yhdeksäsluokkalaisilla ja 
etenkin aikuisilla. Kuudesluokkalaisilla hajonta kummassakin arvossa 
on suurta ja viittaa toisaalta puhutun kielen kaltaiseen yksinkertaiseen 
rakenteeseen, toisaalta lauseenmuodostamisongelmiin. 
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Unelmasanaston semanttinen analyysi 


Unelmasanaston semanttinen analyysi alkaa sanaluokkajaolla, joka on 
perustaltaan ontologis-semanttinen: substantiiveilla nimetään olioita, 
adjektiiveilla niitä kuvaillaan ja verbeillä predikoidaan substantiiveilla 
nimettävistä olioista paitsi tapahtumia myös tiloja. Tämä kuvaus edustaa 
tietysti sanaluokkia prototyyppeinä (Croft 1991), ja se korreloi kielittäin 
muun muassa merkinnän, kuten taivutuksen ja johtamisen, luontee- 
seen ja määrään (suomesta ks. Pajunen 1994; 1998; 2010). Substantii- 
vit, verbit ja adjektiivit edustavat niin sanottuja pääsanaluokkia, ja ne voi- 
daan määritellä paitsi ontologis-semanttisesti myös fonologisin, morfo- 
logisin, syntaktisin ja pragmaattisin kriteerein. Keskitymme tässä yhtey- 
dessä analysoimaan semanttisesti erityisesti substantiiveja ja vain sivuam- 
me muita sanaluokkia, koska juuri substantiivien semanttinen luokitus 
paljastaa parhaiten kirjoitelma-aiheen käsittelyn iänmukaiset muutok- 
set. Substantiivien luokituksesta ja niiden roolista Unelmakirjoitelmis- 
sa ei myöskään ole aiempaa tietoa (Koulukorpuksen adjektiiveista, ks. 
Kuisma 2011; adverbeista, ks. Koivunen 2012; verbeistä ks. Pajunen 
2012). Kieliopillisia sanaluokkia ei tässä yhteydessä analysoida määriä 
pidemmälle (Koulukorpuksen konjunktioista ks. Nahkola 2012; modaa- 
lisuuden ilmaisuista ks. Keskinen 2012; pronomineista Palonen 2013). 

Substantiivien analyysi nojaa paitsi semanttiseen kirjallisuuteen (Mil- 
ler 1998; Frawley 1992; Ravid 2006; Gärdenfors 2014) myös subjek- 
tiivisia semanttisia muuttujia arvioivien testien tuloksiin (vrt. Stavroula- 
Thaleia, Vigliocco, Del Campo, Vinson & Andrews 2011; Söderholm, 
Häyry, Laine & Karrasch 2013; Yap, Lim & Pexman 2015, Pollock 2018). 
Adjektiivien luokitus noudattaa Dixonin (1977, 2004) tunnettua luoki- 
tusta (ks. myös Pajunen 1994), verbien luokitus perustuu suomesta 
tehtyihin analyyseihin (Pajunen 1999; 2001; 2006), ja adverbit on luo- 
kiteltu lähinnä perinteisen kieliopin mukaisesti. Subjektiivisilla testeillä 


18 Kouluikäisten sanastonhallintaa hankkeessa ovat erilaisin testein tutkineet muun muassa Härkönen 
(2012, verbi-idiomit), Jääskeläinen (2008, verbisanasto), Rantala (2012, olotilanilmaukset), Routama 
(2008, spatiaalinen sanasto) ja Turunen (2012, abstraktisanat). 
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saadaan esiin kielenkäyttäjän näkemykset esimerkiksi sanan konkreetti- 
suudesta, tuttuudesta tai vaikkapa sen herättämän tunteen voimakkuu- 
desta tai merkityksen kielteisyydestä. Lisäksi luokittelussa välttämättä 
sivutaan Popperin esittämää todellisuuden kolmijakoa fysikaalisten 
ja mentaalisten olioiden ja tapahtumien maailmaan (maailmat 1 ja 2) 
sekä abstraktien entiteettien maailmaan (maailma 3), koska olioista 
voidaan puhua monilla eri todellisuustasoilla. Esimerkiksi sana koulu 
voi viitata tiettyyn koulurakennukseen, tietyn asteen koulutusta anta- 
vaan kouluun sekä instituutioon. Tämän kanssa risteää käsitteen ja sen 
toteutuman tai esiintymän suhde, joka voi todellisuudessa niin ikään 
olla monikerroksinen (ks.Wetzel 2009). Esimerkiksi aineesta voidaan 
puhua abstraktimmalla (hyvä ruoka) tai sen toteutuman konkreettisem- 
malla tasolla (jäätelötuutti). Unelmasanaston vertailussa olisi hyväksi, 
jos aineisto olisi kauttaaltaan voitu luokitella tyyppi-esiintymä-tasoisesti, 
mutta käytännössä tällainen tarkkuus on isossa aineistossa mahdoton. 
Substantiiviaineisto on luokiteltu myös suhteessa hierarkiatasoihin, joita 
tässä yhteydessä käsitellään vain oletuksella, että perustason jäsenet ovat 
johtamattomia sanoja (kissa, koira), geneerisen tason jäsenet voivat olla 
sekä johtamattomia että johdettuja (eläin, elolliset), ja spesifin tason jä- 
senten sanarakenne voi olla mikä tahansa mutta tyypillisimmin johdos 
tai yhdyssana (vrt. Taylor 1995, 46-51). Lisäksi aineistoon on koodattu 
erikseen lekseemit, joiden tarkoite on jossain määrin opaakki (puuha, 
kamppeet, vehje, kamat); tähän luokkaan kuuluvat myös relationaaliset 
sanat (siivu, viipale, lohko). 

Kielenhallinnan ja kirjoittamisen kehitys näkyy jo sanaesiintymien 
sisäisestä jakaumasta sanaluokkiin (ks. taulukko 8). Adjektiivi- ja sub- 
stantiiviesiintymien määrä nousee lineaarisesti, verbien, konjunktioiden 
ja pronominien määrä laskee yhtä lailla lineaarisesti. Erot selittyvät joko 
kerronnan monipuolistumisen kautta tai sitten niitä selittää tendenssi 
yksinkertaisesta kompleksiin. Substantiivien osuus kasvaa määrällisesti 
eniten. 

Lekseemimäärät ovat substantiiveissa suurimmat ja muissa leksikaali- 
sissa luokissa — verbeissä, adjektiiveissa ja adverbeissa — pienempiä mutta 
muissa luokissa yksittäisillä lekseemeillä on enemmän esiintymiä. Kor- 
kein toisteisuus on verbi- ja adverbilekseemeillä (ks. kaavio 8). Toistei- 
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Taulukko 8. Unelmakirjoitelmien sanaesiintymät sanaluokittain ja ikäluokittain. 


Sanaesiintymät sanaluokittain / Ikäluokka % Alakoulu Yläkoulu Aikuiset 
Adjektiivit 5,8 7,0 9,4 
Adverbit 13,4 13,7 12,2 
Konjunktiot 11,0 10,2 7,0 
Numeraalit 1,3 LI 0,8 
Pronominit 10,4 9,3 7,4 
Substantiivit 27,5 28,7 36,8 
Verbit 30,6 29,8 26,2 

25 

20 


15 

Alakoulu 
—WN 

10 N == Yläkoulu 
N Aikuiset 

5 

0 

Verbit Adverbit Adjektiivit Substantiivit 
Sanaluokka 


Kaavio 8. Saman lekseemin toisteisuus (kpl keskimäärin) ikäluokittain ja sana- 
luokittain. 


suus laskee kehityksellisesti, ja ero on suurin alakouluikäisten ja muiden 
välillä.9 Substantiivit voivat olla sanarakenteeltaan johtamattomia, joh- 
dettuja tai yhdyssanoja, muut ovat pääasiassa joko johtamattomia tai 
johdettuja. 


19 Murrosikä tai kehitystaantuma saattaa näkyä U-muotoisena kehityksenä lineaarisen sijaan (vrt. esimer- 
kiksi McNeil 2007), ulkoisen motivaation puute pelkästään poikkeuksena. Mainittakoon, että ulkoisen 
motivaation puute heijastuu eniten tuotettujen sanojen määriin, ei niinkään osaamistasoon (vrt. Kyösti 
2018; Pajunen & Vainio, tämä teos). 
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Myös yhden esiintymän lekseemien eli HL-lekseemien (hapaks 
legomenon) määrä muuttuu kehityksellisesti siten, että niiden määrä on 
aikuisilla aina suurempi kuin koululaisilla. Kehityksellinen muutos on 
suurin adjektiivilekseemeissä eli 13 prosenttiyksikköä. HL-lekseemien 
määrä on adjektiivi- ja substantiiviesiintymistä 6-13 prosenttia ja verbi- 
ja adverbiesiintymistä vain 1,3—3 prosenttia; ero liittyy sanaluokkien lek- 
seemimääräeroihin. 


SUBSTANTIIVIEN SEMANTTINEN LUOKITUS 

Substantiiveja voi semanttisesti jaotella monella tavalla ja joka luokituk- 
sessa on rajatapauksia. Lähtökohta voi olla käsitteellinen WordNet-ajat- 
telun tapaan (ks. Miller 1998, 29; Vossen 2002, 5). WordNet-luokitus 
koostuu niin sanotuista synonyymijoukoista (synset), joissa sanat ovat 
oletuksen mukaan keskenään vaihdettavissa. Luokituksessa on 25 niin 
sanottua aloittajakategoriaa, ja entiteetit on jaoteltu kategorioittain toi- 
saalta ominaisuuksia periyttäväksi hierarkiaksi, toisaalta yksittäisiksi. 
Hierarkiassa alaluokkia ovat organismit (eläimet, inhimilliset, kasvit), 
objektit (artefaktit, luonnonilmiöt, aine), abstraktiot (ominaisuus, määrä, 
suhde, aika) sekä psykologiset ominaisuudet (kognitio, emootio ja moti- 
vaatio). Alaluokittamattomia entiteettejä ovat aktiviteetti ja tapahtuma, 
paikka ja tila, ryhmä, omistus ja muoto. Millerin luokitusta on sovellettu 
lukuisissa WordNetin kielisovelluksissa (ks. esimerkiksi Fellbaum 1998; 
Vossen 2002). Substantiivit on Unelmaluokituksessa jaoteltu Millerin 
luokitusta soveltaen neljään pääryhmään a)—d) mutta pääasiassa käsitte- 
lemme substantiiveja näiden ryhmien alaryhminä, joissa on jonkin ver- 
ran otettu tyyppi-toteutuma-jakoa huomioon: 


a) Organismit: inhimilliset (yleiset ja roolinimet), elolliset (eläimet, 
kasvit; elollisista predikoitavat tilat ja tapahtumat; ruumiinosa- 
nimet) 

b) Objektit ja muut: elottomat (konkreettiset ja laskettavat esineet; 
konkreettiset spatiaaliset rakennelmat) sekä ainesanat (aine; ruoka- 
nimi ja ruoka-annos), luonnontapahtumat, kollektiivit ja instituu- 
tiot; spatiaaliset alueet ja luonnolliset muodostelmat; tapahtuma- 
nimet 
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c) Abstraktiot: abstraktioasteeltaan vaihtelevat asianimet, tempo- 
raaliset nimet 
d) Luokittelun ulkopuoliset 


Substantiivien luokittelu heijastaa paitsi Millerin luokitusta myös elolli- 
suus- ja konkreettisuusasteikkoa (ks. myös Frawley 1992; Ravid 2006; 
Gärdenfors 2014, 115-134). Osaksi luokittelu on riippuvainen aineistosta. 
Elollisuusasteikolla oliot jakautuvat inhimillisiin, elollisiin, elottomiin 
konkreettisiin sekä abstrakteihin. Flollisuus voidaan määritellä joko bio- 
logian (kädelliset ja muut eläimet, kasvi, bakteeri ja niin edelleen) tai 
kielen kriteerein (ihminen, korkeaelollinen eli inhimillistettävä, mieliku- 
van luova eläin, muut eläimet ja niin edelleen) (ks. esimerkiksi Frawley 
1992, 89). Konkreettisuusasteikolla konkreettisuus vähenee suunnil- 
leen suhteessa elollisuusasteikkoon mutta alaluokissa vaihtelevammin. 
Konkreettisimpia ovat niin elolliset, havaittavat, kosketeltavat kuin las- 
kettavat ja manipuloitavat materiaaliset objektit. Konkreettisuus laskee, 
jos elottomalla oliolla on suuri ulottuvuus, koko tai vastaava (esimerkiksi 
vuori vs. käteen mahtuva kivi), mikä estää sen käsiteltävyyttä, kosketelta- 
vuutta ja kerralla havaitsemista (ks. Wetzel 2009; Pajunen, Itkonen & 
Vainio 2016; Rosen 2017). Oliot — ja niiden nimet — eivät kuitenkaan 
sijoitu suoraan kummallekaan asteikolle, joten aineisto on ensin luoki- 
teltu pienempiin semanttisiin luokkiin, joiden elollisuus- ja konkreetti- 
suusaste on arvioitu myöhemmin erikseen. Niin sanottujen subjektiivis- 
ten semanttisten ominaisuuksien — kuten konkreettisuus, kuviteltavuus, 
polaarisuus ja niin edelleen — arviointi perustuu koehenkilötesteihin, ja 
ne arvioidaan asteikollisina (ks. esimerkiksi Pajunen & Itkonen 2019). 
Elollisuusasteikon elolliset lukeutuvat organismeihin, ja ne on melko 
helppo yksilöidä. Organismeihin sijoittuvat tässä yhteydessä myös elolli- 
siin osa-kokonaisuussuhteessa olevat ruumiinosanimet ja edelleen elol- 
lisesta predikoitavat fysiologiset ja psykologiset tilat ja tapahtumat (uni, 
stressi; alitajunta, innostus), jotka elollisuusasteikolla edustavat abstraktio- 
ta. Elottomia objekteja ovat kaikki (melko) konkreettiset oliot, joita ei ole 
luettu elollisiin. Kaavioissa elottomia eritellään tarpeen mukaan eri ala- 
luokkiin. Rajatuimmin elottomilla viitataan esineisiin (kynä, pöytä, ovi), 
rakennelmiin (laituri, kivitalo) sekä ontologialtaan useammantasoisiin 
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instituutioihin (koulu, kirkko, häät), jotka kirjoitelmissa edustavat sekä 
olioita (esimerkiksi koulurakennus) että instituutioita. Nämä elottomat 
eivät ole merkittäviä alueellisilta ulottuvuuksiltaan toisin kuin varsinai- 
set spatiaaliset alueet ja niihin viittaavat sanat (suo, viljelmä). Unelma- 
sanaston ainesanoista suuri osa liittyy ruokaan, ja erityisesti nimetään 
ruokien nimiä ja ruoka-annoksia, koska syöminen kuuluu oleellisesti 
päiväskriptiin. Ruoka edustaa käsitteen tasoa (type) ja ruoka-annos sen 
toteutumaa (token). Näitä ruoan toteutumia on erityisen paljon koulu- 
laiskirjoittajilla, mutta eroa ei ole erikseen taulukoitu. 

Konkreettisuusasteikon jaossa on oleellista erottaa havaittavat (pöytä, 
juosta, vieri) ja materiaaliset (pöytä) havainnontakaisista (ajatella, ajatus, 
päätös) ja immateriaalisista (ajatella, juosta, vieressä). Havaittavia ja mate- 
riaalisia voi todennäköisesti koskettaa ja liikuttaa, ne sijaitsevat jossakin 
ja niillä on muoto, hahmo tai muu sellainen. Periaatteessa kaikkein 
konkreettisimpia ovat ne, jotka voidaan havaita kaikilla aisteilla (näkö, 
kuulo, haju, maku, tunto ja tuntoaistin alatyypit kosketus, asentoaisti ja 
niin edelleen) eli esimerkiksi laskettavat ja kosketeltavat esineet. Havait- 
tavia ja immateriaalisia ovat konkreettiset teot ja esimerkiksi läheisyyden 
ja etäisyyden relaatiot. Brysbaertin, Warrinerin ja Kupermanin (2014) 
40000 sanan konkreettisuusarvioinneissa koehenkilöt nojautuivat 
useimmiten visuaaliseen ja haptiseen aistiin. Sellaisten substantiivien 
konkreettisuus onkin yleensä korkea, joiden kuviteltavuuskin on korkea, 
joista on melko helppo saada mielikuva. 

Suomalaiskoehenkilöt (yhteensä 28) arvioivat eri semanttisiin luok- 
kiin kuuluvia sanoja sekä kuviteltavuuden että konkreettisuuden suh- 
teen. Arviontiasteikko oli 1-5. Tulosten mukaan objekti- eli esinesanojen 
sekä luonto- ja ainesanojen kuviteltavuus on hyvin korkea ja niiden 
konkreettisuus on joko hyvin korkea (esineet) tai melko korkea (luonto- 
sanat). Relationaaliset sanat jakaantuivat sekä kuviteltavuuden että konk- 
reettisuuden suhteen pääasiassa niiden moniontologisuuden mukaan: 
esimerkiksi sanoilla raja, kolkka tai pieli voi olla sekä spesifi merkitys 
(mökki lähellä Venäjän rajaa) että yleinen, abstraktimpi merkitys (rajana 
vain mielikuvitus). Abstraktisubstantiivien kuviteltavuus on matala, mut- 
ta konkreettisuusasteikoille ne sijoittuvat koehenkilönäkemysten mu- 
kaan joko melko abstrakteihin (haju, tauko, huhu), abstrakteihin (huoli, 


90 ANNELI PAJUNEN JA MARI HONKO 


https://doi.org/10.21435/skst.1472 


harmi) tai hyvin abstrakteihin (usko). Tama ero luonnollisesti kuvastaa 
taas kerran eroa tyypin ja sen toteutuman välillä (vertaa hieno tuoksu ja 
laittaa tuoksu). 

On syytä huomata, että vaikka konkreettisuus voidaan perustaa onto- 
logisiin kriteereihin, abstraktius liittyy sekä kieleen että mieleen. Lisäk- 
si abstraktit merkitykset voivat olla kulttuurisia ja osin yksityisiäkin. 
Oppimisen kannalta ero on huomattava ja vaikuttaa oppimisen lisäksi 
käyttöön. Konkreettisuusasteikko on kehitykselliseltä kannalta mielen- 
kiintoinen ja tiedetään, että erityisesti substantiiviluokissa kielen ja 
kirjoittamisen kehitys näkyy tekstin abstraktistumisena (Ravid 2006). 
Alakouluikäisillä onkin vielä paljon puutteita abstraktisanaston hallinnas- 
sa (ks. esimerkiksi Turunen 2012). Puutteet heijastuvat hyvin todennä- 
köisesti myös abstraktisanaston käyttöön, koska konkreettisten sano- 
jen motivoituva syntaksi hallitaan paremmin kuin motivoitumattoman 
abstraktisanaston. Fro näkyy niin kokeellisesti (ks. esimerkiksi Barsalou 
2008) kuin erityisryhmilläkin (Kukkonen & Pajunen 1985). 

Koko Unelma-aineistossa on analysoitavia substantiivilekseemejä 
8 863 ja niiden esiintymiä yhteensä 63 651.” Substantiivien semanttisten 
luokkien jakaumat ovat eri ikäryhmissä aika samanlaisia, mutta selvä 
siirtymä konkreettisista abstrakteihin on näkyvissä. Vastaava kehityksel- 
linen trendi on vielä selvempi substantiiviesiintymissä (ks. taulukko 9). 
Keskeinen on 5-10 prosenttiyksikön siirtymä inhimillisistä ja elollisista 
sekä konkreettisista elottomista abstraktimpiin luokkiin. Toisin sanoen 
aivan odotuksenmukaisesti iän myötä kirjoitetaan samasta aiheesta sel- 
västi abstraktimmin. Ainesanojen osuus pienenee; ruoasta puhutaan 
hieman vähemmän. Inhimillisten roolinimistä (opettaja, kirjailija) ja 
ryhmistä (porukka, ryhmä, pelijoukkue) kirjoitetaan samoin tai hieman 
enemmän vanhemmissa ikäryhmissä, samoin aluesanoista ja spatiaali- 
sista ulottuvuuksista (metsä; kulkureitti, matka), mutta elollisista — kuten 
lemmikeistä — kirjoitetaan vähemmän. Ajan ilmaukset (ikä, kuukausi, tu- 
levaisuus, vapaapäivä) lisääntyvät. Suurimmat prosentuaaliset muutokset 


20 Testin jälkeen koehenkilöt kommentoivat raja-tyypin sanojen luokittelua sanomalla, että oli vaikea tie- 
tää, pitikö luokitella yleistasolla vai ei. 

21 Substantiiviluokituksen on tehnyt kaksi henkilöä toisistaan riippumatta ja tulokset on myöhemmin 
yhtenäistetty. 
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Taulukko 9. Substantiiviesiintymien jakauma semanttisiin luokkiin ikäluokittain. 


Substantiiviesiintymien Alakoulu Yläkoulu Aikuiset 
semanttinen luokitus n = 22560 n = 9779 n = 26477 
/ Ikäluokka % 

Inhimillinen 10,4 7,5 6,6 
Inhimillisten rooli 2,3 2,5 213 
Elolliset 6,5 4,6 2,5 
Inhimillisen tai elollisen tila tai osa 3,2 4,4 8,3 
Ryhmä T2 L5 L5 
Aine 8,1 9,0 7,0 
Eloton 30,8 28,0 22,5 
Alue 6,5 7,8 6,7 
Ulottuvuus 2,2 2,7 2,5 
Relaatio 0,8 1,2 11 
Aika 14,5 15,5 16,0 
Asia 13,5 15,3 22,9 


koskevat elottomia konkreettisia objektisanoja (31 % > 22 %) ja elottomia 
abstraktisanoja (13 % > 23 %). Elottomien alaluokissa muutos nakyy par- 
haiten esinenimien vähenemisenä ja teon nimitysten lisääntymisenä. 
Esinenimet (kumi, kynä) ovat konkreettisuusasteikolla korkeammalla 
kuin teonnimet (vihellys, potku), joten elottomiin viittaavan substantiivi- 
luokan sisälläkin näkyy iänmukainen abstraktistumismuutos, vaikka 
luokan koko sinänsä pienenee iän mukaan. Jos luokituksessa olisi otettu 
huomioon myös se, viittaako kirjoittaja käsitteeseen tai instituutioon 
niiden toteutumien sijaan, kehityksellinen ero näkyisi selvemmin. 

Suurimmat kehitykselliset muutokset esiintymätasolla näkyvät siis 
objektisanoissa ja abstraktisanoissa. Jos eroa tarkastellaan lekseemitasol- 
la ja esiintymäluokkatasolla (kaavio 9), nähdään, että koululaisilla ja ai- 
kuisilla näiden sanojen luokat koostuvat osin samoista lekseemeistä, 
mutta erot kasvavat siten, että koululaisilta puolet koko aineiston yh- 
teenlasketuista abstraktisanoista puuttuu, aikuisilta vain noin 30 pro- 
senttia. Lisäksi aikuisilla on abstrakteja HL-lekseemejä enemmän kuin 
koululaisilla. Objektisanoissa tilanne on päinvastainen. Erot näkyvät vie- 
lä sellaisissa yleisyysluokkien lekseemeissä, joissa esiintymiä on muuta- 
ma (>2 kaaviossa 9). Hyvin yleisiä luokan jäseniä on molemmilla vähän 
ja eroja ei niissä sanottavasti ole. 
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Kaavio 9. Elottomiin ja abstrakteihin viittaava sanasto koululaisilla ja aikuisilla 
jaoteltuna yhteiseen sanastoon (sanan esiintymia luokittain yli sata, yli kymmenen, 
yli kaksi, vain yksi) ja erilliseen sanastoon (sana ei esiinny molemmilla ryhmillä 
eli ei ole yhteinen). 


Substantiivit viittaavat olioihin, jotka voi luokitella konkreettisuusastei- 
kolle hieman eri kohtiin riippumatta siitä, mihin semanttisiin luokkiin 
ne kuuluvat. Esimerkiksi konkreettisen, ihmisen tekemän, laskettavan 
ja manipuloitavan kokoisen esineen (kynä, kuppi) konkreettisuus on kor- 
keampi kuin spatiaalisen alueen (piha, metsä, saari), kuten jo todettiin 
ja kuten koehenkilöiden testaus myös osoitti. Vastaavasti fysiologinen, 
elollisesta predikoitava tapahtuma (sydänkohtaus, haukotus) on konkreet- 
tisempi kuin vastaava mentaalinen tila tai tapahtuma (ajatuksenjuoksu, 
uteliaisuus). Lisäksi vaikka sanan tarkoite olisi konkreettinen, sana ei 
välttämättä kielennä tarkoitetta kovin konkreettisena. Esimerkiksi sanat, 
jotka viittaavat yksilöitäviin olioihin (mies) ovat asteikolla konkreettisem- 
pia kuin yksilöistä koostuviin kollektiiveihin viittaavat sanat (miesryhmä, 
miesjoukko), vaikka inhimilliset sinänsä kuuluvat asteikolla ykkössijalle. 
Vastaavasti sanan merkityksen granulariteetti eli yksityiskohtaisuus voi 
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Taulukko 10. Substantiiviesiintymien jakauma konkreettisuusasteikolle ikäryhmittäin. 


Konkreettisuusasteikko / Ikäluokka % Alakoulu Yläkoulu Aikuiset 
1, konkreettinen 37,8 30,3 25,0 
2 29,8 32,1 26,8 
3 21,5 24,1 24,9 
4 10,1 IL5 18,5 
5, abstrakti 0,9 2:0 4,8 


vaikuttaa konkreettisuuteen. Esimerkiksi hyponyymi-hyperonyymisuh- 
teisessa hierarkiassa hyperonyymi (laji, eläin) luokittuu vähemmän 
konkreettiseksi kuin perustason (koira) tai spesifitason (susikoira) sana. 
Meronyymi-holonyymisuhteiset sanat voivat olla vähemmän konkreetti- 
sia kuin hyponyymi-hyperonyymisuhteiset, mutta erityisesti relationaa- 
liset, elottoman osan ja kokonaisuuden suhdetta ilmaisevat sanat ovat 
tilanteisia tarkoitteitaan vähemmän konkreettisia. Esimerkkinä voi mai- 
nita suomen lukuisat erilaisia reunaosia kielentävät sanat (sivu, laita, 
syrjä, pääty jne.). 

Sekä substantiivilekseemien että -esiintymien (ks. taulukko 10) yhtey- 
dessä konkreettisuus vähenee kehityksellisesti lähes lineaarisesti. Erot 
alakoululaisten ja aikuisten välillä ovat asteikon ääripäissä yli 10 prosentti- 
yksikön luokkaa eli myös tilastollisesti merkitseviä. Konkreettisuusluo- 
kituksessa inhimilliset ja elolliset sekä etenkin konkreettiset esinesanat 
edustavat konkreettisimpia, kollektiivisanat, ainesanat ja aluesanat pää- 
osin luokkaa 2. Luokkiin 3 ja 4 sijoittuu vielä kuviteltavissa oleviin tar- 
koitteisiin viittaavia jo jonkin verran abstrakteja sanoja ja erilaisia ver- 
baalisiin tarkoitteisiin viittaavia sanoja. Kumpaankin ryhmään kuuluvia 
sanoja voidaan ajatella joko yksilöivästi tai yleistasolla (esimerkiksi alle- 
kirjoitus todistuksessa tai todisteena), tai niihin voi liittyä voimakkaita 
negatiivisia tunnereaktioita (sää, kirous) ja siten konnotaatioita käytön- 
kin tasolla. Puhtaan abstrakteja ovat sanat, jotka eivät herätä mielikuvia 
tai (yleensä) kielteisiä tunnereaktioita (esimerkiksi hyvyys, aitous) (ks. 
Söderholm ja muut 2013). 

Substantiivit eroavat muiden pääsanaluokkien sanoista sikäli, että lek- 
seemien määrä on suuri ja yksittäisen lekseemin yleisyys pieni. Suurin 
osa Unelmasanaston substantiiveista kuuluukin yleisyystasolle 10 (me- 
diaani), ja aika monissa semanttisissa luokissa neljännes substantiivi- 
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lekseemeistä on harvinaisia tai puuttuu lehtikorpuksesta. Kirjoitelman 
näkökulma aiheeseen ja kulloinenkin teema vaikuttavat substantiivi- 
sanastoon enemmän kuin muiden sanaluokkien valintoihin. Ero eten- 
kin verbeihin on huomattava. Yleisimmät substantiivilekseemit löytyvät 
luokista inhimillisen rooli, kollektiivi, aika ja abstraktisana. Substantiivi- 
sanastossa näkyy yleisyysmuutoksia semanttisen luokan ja iän mukaan, 
muun muassa inhimillisiin viittaavat lekseemit sekä aika ja abstrakti 
-lekseemit harvinaistuvat iän mukaan. Koululaisilla roolinimet ovat har- 
vinaisempia, ja toisaalta sekä elollisiin että elottomiin viittaavat sanat 
ovat yleisempiä kuin aikuisilla. Kehitykselliset erot eivät tosin ole kovin 
suuret. Aika usein ero näkyy siten, että kaikkein yleisin tietyn luokan 
sanasto puuttuu aikuisilta. 

Koululaisilla johtamattomat sanat hallitsevat kaikissa semanttisissa 
substantiiviluokissa. Tämä on odotuksenmukaista, koska vielä yhdeksäs- 
luokkalaisillakin on puutteita derivaation hallinnassa (ks. Vainio ja muut 
2019). Aikuisilla johtamattomia on paljon luokissa inhimillinen, eloton 
ja asiasana sekä myös elollisen tilaa tai osaa nimeävissä. Kummallakin 
ikäluokalla yhdyssanoja on eniten elottomiin ja asioihin viittaavissa sa- 
noissa. Nämä ovatkin aineiston suurimmat semanttiset luokat. Myös 
saman lekseemin toisteisuus siirtyy abstraktimpiin sanoihin iän myötä. 
Leksikaalisessa hierarkiassa johtamattomat sanat ilmaisevat tyypillisesti 
perustasoa (kissa, koira) ja johdetut ja yhdyssanat spesifiä tasoa (siamilai- 
nen, kisuliini). Siten spesifin tason sanoilla kielennettäessä granulariteetti- 
aste on korkeampi kuin perustason sanoilla. Koululaisten ja aikuisten 
suurimmissa substantiiviluokissa eli objekti- ja asiasanoissa granulari- 
teettiero tulee näkyviin erityisen hyvin, jos verrataan sanarakennemuu- 
tosta kunkin semanttisen luokan sisällä: aikuisilla johtamattomat sa- 
naesiintymät laskevat koululaisiin verrattuna elottomiin viittaavissa 
ja asiasanoissa yli 10 prosenttiyksikköä ja inhimillisiin viittaavissa yli 
30 prosenttiyksikköä johdettujen hyväksi. Aikuisilla toisin sanottuna 
substantiivisanasto harvinaistuu sekä abstraktistuu ja ilmaus samalla 
täsmentyy. 
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MUIDEN LEKSIKAALISTEN SANALUOKKIEN SEMANTTINEN LUOKITUS 
Verbit on luokiteltu toisaalta aikapaikkaisia asiantiloja kielentaviin ja toi- 
saalta niihin, joilla koodataan asiaintiloihin suhtautumista tai vastaavaa. 
Adjektiivit puolestaan on luokiteltu niiden kielentämän ominaisuuden 
mukaan. Adverbit jakautuvat ajan, tavan, paikan ja määrän, intensiteetin 
sekä kommenttien ilmaisuihin. Vertailemme tuloksia ensin semanttisten 
luokkien perusteella ja siirrymme sitten yleisyystasoittaiseen analyysiin. 

Asiantiloja kielentävissä verbeissä on teko- ja tapahtumaverbejä, tila- 
verbejä ja liikeverbejä, suhtautumista tai vastaavaa ilmaisevissa mentaali- 
verbejä eli aistihavainto-, emootio-, kognitio- ja kommunikaatioverbejä. 
Lisäksi on erotettu muutama pienryhmä. Luokkien erottelukriteerit ovat 
paitsi semanttisia myös syntaktisia (ks. Pajunen 2001). Merkitykseltään 
melko konkreettisilla verbeillä (havaittavat immateriaaliset) ilmaistaan 
tekoja, tapahtumia ja tiloja mutta iän myötä samoja verbejä aletaan käyt- 
tää abstraktimmin. Esimerkiksi yleiset liikeverbit, kuten mennä ja tulla, 
voivat liikkeen sijaan ilmaista aineiston vanhemmilla koehenkilöillä 
muutosta. Mentaaliverbeillä ilmaistaan asiaintiloihin kohdistuvia propo- 
sitionaalisia asenteita ja referoidaan. Niiden käyttö lisääntyy kehityksel- 
lisesti (ks. myös Pajunen 2012). 

Verbilekseemeissä tapahtumaverbien määrä nousee kehityksellisesti 
ja liikeverbien laskee. Mentaaliverbeissä alakoululaisilla on enemmän 
kommunikaatioverbejä ja aikuisilla kognitioverbejä. Esiintymien osalta 
kehityksellinen muutos on selvempi: mentaaliverbien esiintymämäärät 
— erityisesti kognitioverbien — lisääntyvät, vastaavasti liike- ja tilaverbien 
esiintymämäärät vähenevät (ks. taulukko 11). Teko- ja tapahtumaverbien 
esiintymät sen sijaan nousevat. Muutokset ovat toisin sanottuna ennakko- 
odotuksen mukaisia, ja niitä selittää muun muassa se, että skriptimäi- 
nen, siirtymiä ja rutiineja korostava päiväskeemakirjoittaminen vähenee. 


Taulukko 11. Verbiesiintymien jakauma semanttisiin luokkiin ikäryhmittäin. 


Verbien semanttiset luokat Alakoulu Yläkoulu Aikuiset 
/ Ikäluokka % n = 30664 n = 10184 n = 25048 
Tapahtuma 26,4 28,8 29,4 
Liike 25,7 22,7 17,6 
Tila 23,9 21,8 19,9 
Mentaali 19,0 20,4 26,0 
Kieliopillinen 5,0 6,4 71 
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Lekseemitasolla johdettuja verbejä on enemmän kuin johtamattomia 
muissa luokissa paitsi kieliopillisissa. Verbiyhdyssanat ovat suomen 
kielessä harvinaisia ja niitä esiintyy harvoissa verbiluokissa (ks. myös 
Pajunen 2006). Esiintymätasolla johtamattomat vallitsevat kaikissa 
verbiluokissa. Johdettujen verbien määrä kasvaa ikäryhmittäin kaikissa 
muissa verbiluokissa paitsi tilaverbeissä ja kieliopillisissa luokissa. Eni- 
ten ne lisääntyvät tapahtuma- ja tekoverbeissä, joissa johtaminen muut- 
taa argumenttirakennetta eli on syntaktista (kulua > kuluttaa; aueta > au- 
kaista) tai spesifioi merkitystä (aloittaa > aloitella). Verbimerkityksetkin 
siis spesifioituvat iän myötä. Kognitioverbeissä esiintymät kasvavat sekä 
johtamattomissa että johdetuissa. Verbijohdosten määrän pysyminen 
kuitenkin suhteellisen vähäisenä lienee tekstityyppi- ja aiheominaisuus. 

Unelmasanaston adjektiivit on luokiteltu Dixonin (1977, 2004) perus- 
luokituksen mukaisesti seuraavasti: arvoa tai arvottamista ilmaisevat 
(hyvä, huono, huikea, ihana, merkityksellinen), dimensiota ilmaisevat (ulot- 
tuvuus ja muoto: pitkä, pyöreä), fyysistä ominaisuutta ilmaisevat (kova, 
pehmeä), inhimillistä taipumusta ilmaisevat (avulias, ilkeä, rehti), ikää 
tai aikaa ilmaisevat (nuori, viisivuotias; keväinen, eilisiltainen), materiaa- 
lista ominaisuutta ilmaisevat (arkullinen, kurainen, pilvetön) sekä väriä 
ja nopeutta ilmaisevat. Lisäksi on eroteltu suomessa adjektiiviluokkaan 
kuuluvat järjestys (viimeinen, seuraava), kansalaisuus (ulkomaalainen, 
ruotsalainen; ruotsinkielinen), pronominaalit ja muut (satunnaismuodos- 
teet). 

Adjektiivilekseemit jakautuvat näihin semanttisiin luokkiin odotuksen- 
mukaisesti siten, että fyysistä ja materiaalista ominaisuutta ilmaisevia 
on paljon, inhimillistä taipumusta ilmaisevia suhteellisen paljon. Sen 
sijaan arvoa ja arvottamista ilmaisevia on paljon odotusarvoon nähden, 
mutta ero johtuu osaksi siitä, että aineisto on koodattu ennemmin käyt- 
tötapaa kuin yksittäistä lekseemiä painottaen. Arvoa ilmaisevia leksee- 
mejä on suomen kielessä melko vähän, mutta arvottamista voi ilmaista 
subjektiivisin painotuksin. Osaksi arvolekseemien yleisyys johtuu myös 
kirjoitelmien aiheesta, sillä monet kirjoittajat ovat pyrkineet evaluoi- 
maan unelmapäivän käsitettä. Evaluointipyrkimys nostaa myös värilek- 
seemien määrää. Fvaluointi nousee vielä merkittävämmäksi adjektii- 
viesiintymien osalta (ks. taulukko 12): arvoa ja arvottamista ilmaisevia 
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adjektiiveja käytetään eniten sekä koululaisilla että aikuisilla (yli kolman- 
nes esiintymistä). Dimensiota ja fyysistä ominaisuutta ilmaistaan lähes 
yhtä usein, muissa luokissa esiintymämäärät jäävät melko vähiin. 

Koululaisten ja aikuisten välillä on havaittavissa tässäkin yhteydessä 
kehityksellinen ero siten, että koululaiset arvottavat adjektiiveilla useam- 
min kuin aikuiset ja ilmaisevat myös ulottuvuuksia useammin. Nuo- 
rimmilla arvottaminen voi tosin olla kiva/hyvä-toteamusta (vrt. Kuisma 
2011) sen sijaan, että teksti rakennettaisiin arvoja perustellen. Aikuiset 
ilmaisevat koululaisia useammin fyysisiä ja materiaalisia ominaisuuksia 
sekä inhimillisiä taipumuksia. Aikuisilla on lähes jokaisessa semantti- 
sessa luokassa enemmän lekseemejä kuin koululaisilla, toisin sanottuna 
diversiteetti on korkeampi. Koululaisilla on enemmän värilekseemejä ja 
-esiintymiä. 


Taulukko 12. Adjektiiviesiintymien jakauma semanttisiin luokkiin ikäluokittain. 


Adjektiivien luokka Koululaiset Aikuiset 
/ Ikäluokka % n =7680 n = 8197 
Arvo 39.7 36,1 
Dimensio 17,3 13,5 
Fyysinen 13,3 16,7 
Inhimillinen 5,6 9,0 
Järjestys 47 39 
Materiaalinen 2,7 47 
Temporaalinen 6,6 7,3 
Väri 45 3,0 
Muu 5.7 5,8 


Adverbit on luokiteltu aikaa (jo, pdivittdin, kauan), paikkaa (kotiin, loitolla, 
taakse, ääreen), tapaa (alasti, hellästi, hissukseen, jalan), määrää (kerrallaan, 
lähes, osaksi, vailla) ja suhtautumista ilmaiseviin (muka, kenties, varmasti, 
valitettavasti) adverbeihin sekä intensiteetin ilmaisuihin (sangen, perin, 
kunnon) ja pronominaaleihin (jotenkin, miltei, silloin), jotka voivat ilmais- 
ta kaikkia adverbien tavallisia funktioita ja lisäksi toimia lauseita yhdis- 
tävinä elementteinä. Koululaiset käyttävät aikuisia enemmän kaikkien 
muiden adverbiluokkien lekseemejä paitsi kommentti- ja tapa-adverbeja. 
Erot ovat melko suuria lähinnä paikan adverbeissa koululaisten hyväksi 
ja tavan adverbeissa aikuisten hyväksi (noin 5 prosenttiyksikköä ja yli 
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10 prosenttiyksikköä). Esiintymien osalta aikuiset käyttävät enemmän 
ajan, määrän ja tavan ilmaisuja ja myös kommenttiadverbeja (taulukko 
13). Aineisto siten osoittaa, että aikuiset paitsi kehystävät kerrontaansa 
enemmän kuin kouluikäiset, he myös evaluoivat sitä melko monipuoli- 
sesti. Koululaisilla on enemmän proadverbeja (yli 10 prosenttiyksikköä), 
joista huomattava osa syntyy lauseketjutyyppisestä sitten-sanan käytöstä, 
myös paikan adverbeja on koululaisilla enemmän. Intensiteettiadverbeja 
on molemmilla ryhmillä yhtä paljon. 


Taulukko 13. Adverbiesiintymien jakauma semanttisiin luokkiin ikäluokittain. 


Adverbien luokka Koululaiset Aikuiset 
/ Ikäluokka % n = 17844 n = 11372 
Intensiteetti 7,4 7,5 
Kommentti 3,0 6,9 
Määrä 9:7 10,3 
Paikka 20,4 18,5 
Proadverbi 25,0 14,9 
Temporaalinen 24,2 27,1 
Tapa 10,3 14,9 


Verbien, adjektiivien ja adverbien semanttinen analyysi osoittaa selvää 
siirtymää arvioivampaan suuntaan. Asenteiden ilmaisun ja komment- 
tien osuus lisääntyy ja toisaalta subjektiivisen arvottamisen osuus vähe- 
nee. Kehityksellinen ero näkyy sekä yleisyystasojen että ilmaisujen gra- 
nulariteetin nousussa. Tapahtumien, arvojen ja ajan runsas ja lisääntyvä 
kielentäminen puolestaan liittyy kertovaan tekstiin ja kertomusraken- 
teen kehittymiseen. 


Lopuksi 


Unelmasanaston analyysi osoittaa sanojen valintaan liittyvän useanlaisia 
tekijöitä. Osa on tekstin ominaisuuksia, osa liittyy kirjoittajan tyylivalin- 
toihin ja osa on selvästi kehityksellistä. Aineiston hallitseva tekstityyppi 
on kertomus ja kasvava osa niistä on omaelämäkertatyyppisiä. Kertomuk- 
sille ominaisessa sanastossa on paljon tapahtumaverbejä sekä kehys- 
täviä ajan ja paikan adverbeja. Kerronta on usein minämuotoista tai re- 
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feroivaa; tapahtumia koetaan usein yhdessä perheen tai ystävien kanssa 
ja kyseiset tapahtumat pyritään evaluoimaan positiivisiksi. Kirjoitelmien 
aihe Unelmieni päivä tuo paljon päiväskriptisanastoa, ja valitut teemat 
nostavat tiettyjä tapahtumasarjoja esiin: esimerkiksi hääpäivänä toteu- 
tuva unelma koostuu häille tyypillisestä tapahtumasarjasta pukeutumi- 
sesta vihkimiseen, onnitteluihin, hääkakun leikkuuseen, tanssimiseen, 
kukkapuketin heittoon ja häämatkaan. Näihin eri tapahtumiin liittyvä 
sanasto ei vielä yksittäisiä sananvalintoja tarkastelemalla tuo esiin si- 
nänsä juuri kertomukselle tyypillisiä piirteitä eikä myöskään paljasta 
kehityksellisiä trendejä. Kehityksellisiä piirteitä tulee näkyviin erityisesti 
frekvenssitekijöiden, sanaston diversiteetin ja sen granulariteettiasteen 
kautta sekä elollisuus- ja konkreettisuusasteikon muutoksista. 

Myös kertomusrakenteen hallinta on kehityksellistä. Suomalaislapset 
oppivat hallitsemaan kertomusskeemaa keskimäärin ala- ja yläkoulun 
vaihteessa, nuoruudessa kertomusskeema monipuolistuu kuvailuun ja 
arviointiin. Nuorilla aikuisilla kirjoitelma saattaa olla tyylipuhdas kerto- 
mus unohtumattomasta kokemuksesta tai nautinnollisesta päivästä, 
mutta se voi myös olla tunnelmia kuvaileva ja maalaileva tai unelmia 
arvioiva — tai vähän kaikkea. Ehkä vähäinen suunnittelu pitää kerto- 
mukset edelleen vaikka ajallisesti aiempaa tiiviimpinä kuitenkin melko 
kronologisesti etenevinä. Vasta keski-ikäisillä kirjoittajilla tämä kronolo- 
gia näyttää rikkoutuvan, ja kertomus voidaan laatia hyvin monella tapaa, 
kuten Petälä (2018) osoittaa. Kertovaan tekstiin liittynee myös ainakin 
osaksi sanaston suhteellinen yksinkertaisuus, suhteellisen suuri johta- 
mattomien ja melko yleisten sanojen määrä. 

Tyylilliset valinnat tai strategiat heijastuvat myös sanastoon. Kirjoi- 
telmista voi erottaa kaksi vallitsevaa tyylistrategiaa, joista toista voisi ni- 
mittää kuvailemaan pyrkiväksi ja toista pelkistyneeksi. Fdellinen tuottaa 
lapsilla värikkäitä adjektiiveja ja erikoisia juonen käänteitä, vanhemmilla 
kirjoittajilla melko yksityiskohtaista kuvailua, jälkimmäinen enemmän 
toteavaa kerrontaa, jossa päättely jää lukijan kontolle. On myös rönsyile- 
vää ja tiivistä kerrontaa. Tyylilliset valinnat peittyvät usein tilastojen ulot- 
tumattomiin mutta on syytä muistaa, että osa koehenkilö- ja ikäluokka- 
kohtaisesta variaatiosta johtuu tyylillisistä valinnoista. Yhtä lailla on 
kuitenkin syytä panna merkille, että vaikka tyylilliset valinnat vaikuttavat 
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enemmän aikuis- kuin lapsikerrontaan, tutkimus silti paljastaa selviä 
iänmukaisia sanastollisia kehitystrendejä. 

Koululaiset ovat kirjoitelma-aineiston sana-analyysin perusteella kes- 
kimäärin vielä peruskoulun päättyessäkin aika kaukana nuorten aikuis- 
ten tasosta. Tämä näkyy erityisen hyvin niin sanotuista peittoluvuista: 
2000-4000 lekseemiä kattaa koululaisten sanamassasta lähes kaiken 
mutta aikuisilta vain 90 prosenttia. Koululaiskirjoitelmissa on hyvin 
yleisiä ja tavallisia lekseemejä merkitsevästi enemmän kuin aikuiskir- 
joitelmissa; aikuisilla taas harvinaisia lekseemejä on vastaavasti huomat- 
tavasti enemmän. Ero tarkoittaa, että aikuiset ilmaisevat täsmällisempiä 
merkityksiä kuin koululaiset. Sanaesiintymien tasolla massa koostuu 
molemmilla hyvin yleisistä sanoista, mutta yleisyysero näkyy silti. Aikui- 
silla myös johdetut sanat ja kiteytymät ovat yleisyydeltään harvinaisem- 
pia kuin koululaisilla mutta koululaisilla on enemmän harvinaisia 
yhdyssanoja. Ero kuitenkin syntyy koululaisten suosimista satunnais- 
muodosteista, kyse ei ole merkityksen ilmaisun täsmällisyydestä. Taivu- 
tusmuotoanalyysi perustui lekseemeille ominaiseen taivutusmuotopro- 
fiiliin sanomalehtikielessä. Kun tätä profiilia verrattiin unelmasanaston 
yleisyystasoihin, kävi ilmi, että aikuissanasto liittyy vaihtelevampaan syn- 
taksiin kuin koululaissanasto. Tämän voinee tulkita niin, että aikuiset 
kirjoittavat yleiskielen tapaan ja koululaiset poikkeavat siitä enemmän. 
Vastaava kehitys tulee esiin sanaston diversiteettianalyysistä. Nuorilla 
aikuisilla leksikaalinen erilaisuus — eri lekseemien määrä — on selvästi 
korkeampi kuin yhdeksäsluokkalaisilla, jotka taas peittoavat kuudesluok- 
kalaiset. Suurin ero on kolmasluokkalaisten ja kuudesluokkalaisten vä- 
lillä. 

Diversiteettiä mitattiin myös sukupuolten välillä — ainoana tässä tutki- 
muksessa. Tulos oli, että ainoastaan kolmasluokkalaisten tyttöjen ja poi- 
kien diversiteetti eroaa: mediaani on tytöillä korkeampi mutta pojilla 
keskeisten havaintojen hajonta on suurempi. Eron vähäisyys on odotuk- 
sen mukaista, koska muun muassa älykkyystutkimukset eivät osoita se- 
manttisen tiedon sukupuolittuneisuutta. Se on linjassa myös sanasto- 
testiemme tulosten kanssa. Jos sitten sanastotaidot katsotaan luku- ja 
kirjoitustaitojen edellytykseksi, tulos on vähintään mielenkiintoinen. 
Peruskoululaisten aineisto edustaa koko ikäluokkaa, nuorten aikuisten 
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vain ikäluokan koulutetumpaa osaa. Koululaisten tuloksissa on paljon 
poikkeavia havaintoja sekä tytöillä että pojilla mutta aikuisryhmästä 
nämä puuttuvat. Koululaisten aineistosta nouseva suuri poikkeavien ha- 
vaintojen määrä viittaa erityistuen tarpeeseen. Kaikkein poikkeavin osa 
koululaisista eli ne, jotka eivät ole saaneet tekstiä sanottavasti aikaiseksi, 
nostaa tuettavien joukkoa. 

Semanttisesti sanastosta näkyy hyvin aiheen käsittelyn yleinen abs- 
traktistuminen, joka tulee esiin erityisesti substantiivisanastosta mutta 
myös verbisanastosta. Inhimillisistä, elollisista ja konkreettisista elotto- 
mista kirjoitetaan ikäryhmittäin aina vähemmän mutta asioista aina 
enemmän. Tämä tarkoittaa, että vaikka kirjoitelman aihe on kaikilla sa- 
ma, aihe käsitteellistetään korkeammalle abstraktiotasolle ja siitä kirjoi- 
tetaan tiivistetymmin. Kun suunnitteluaikaa ei ollut millään kirjoittaja- 
ryhmällä, ero on kehityksellinen. Substantiivien semanttisista luokista 
näkyy selvä siirtyminen konkreettisista objektisanoista abstrakteihin 
asiasanoihin, mutta muutos tapahtuu myös luokittain siten, että muun 
muassa objektisanoista kirjoitetaan abstraktiotasoltaan korkeammalla 
tyyppien tasolla niiden yksittäisten esiintymäesimerkkien sijaan. Sanas- 
ton harvinaistuminen ja nimeämisen diversiteetin nousu taas osoittavat 
granulariteettiasteen nousun kehitykselliseksi. Yhteenvetona voi siis to- 
deta, että sanamerkitysten abstraktistuminen, harvinaistuminen ja täs- 
mentyminen ovat kehityksellisiä. 

Lopuksi voi vielä pohtia, miksi abstraktistuminen on kehityksellistä. 
Fihän abstrakti teksti aina vaikuta edes tavoiteltavalta. Kehityksellisessä 
kontekstissa eroa voi luonnehtia seuraavasti: Konkreettisten sanojen 
oppiminen ja muistaminen on helpompaa kuin abstraktisanojen, 
konkreettismerkityksistä sanoista keksii paremmin assosiaatioita ja tar- 
koitteet, joihin ne viittaavat, ovat kuviteltavissa ja niistä voi muodostaa 
mielikuvia. Tämä kaikki tukee näiden sanojen käyttöä ja kontekstin hal- 
lintaa. Abstraktit sanat viittaavat kulttuurisiin ja yksilöllisiin konstruk- 
tioihin ja niiden syntaksi opitaan kontekstista — tai analogiasuhteesta 
konkreettisten sanojen käyttöön —, joten niiden syntaksi ei ole motivoi- 
tua (ks. esimerkiksi Barsalou 2008). Abstraktin sanaston oppiminen ja 
käyttöön ottaminen vaatii siis aikaa. Taitava tekstin rakentaminen edel- 
lyttää paitsi yleisyystason nostoa myös kykyä täsmentää ilmaisua. 
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Liiketilanteen vaylan ja suunnan 
kielentaminen suomessa 
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Johdanto 


Kielenhallinnassa voidaan hahmottaa kahtalaisia muuttujia: kehitykselli- 
sesti iän mukana muuttuvia ja toisaalta sellaisia, jotka muuttuvat kehi- 
tyksellisesti mutta myös varioivat ikäluokkatasolla jatkuvasti (tarkemmin 
Pajunen & Honko, johdantoluku). Jälkimmäisen tyypin muuttujissa 
variaatioon voi liittyä kompleksisuutta kielennettävän ilmiön ja kielen 
resurssien tasolla sekä eroja esimerkiksi yksilöpsykologisissa tekijöissä. 
Yksi merkityskenttä, jolla ilmaisu on luonnostaan varioivaa, on liikkeen 
ilmaisu. Liike on keskeinen osa ihmisen kokemusmaailmaa, ja ihmi- 
selle intentionaalisena olentona erityisen tärkeänä näyttäytyy kokemus 
liikkeestä suuntaisena, etenevänä, paikasta toiseen vievänä. Paikanmuu- 
tokseen johtavan liikkeen ilmaisun on esitetty jäsentyvän kielissä kahta- 
laisesti sen mukaan, millä elementeillä niissä tyypillisimmin ilmaistaan 
liikkumisen väylä (esimerkiksi Talmy 2000b). Tätä ensisijaisiin ilmaisu- 
tapoihin perustuvaa, vahvasti yleistävää typologiaa on sittemmin haas- 
tettu kuvaamalla liikkeen kielentämiseen liittyvää laajaa kieltenvälistä 
variaatiota (esimerkiksi Ibarretxe-Antufiano 2009; Goschler & Stefano- 
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witsch 2013) ja osoittamalla yksittäisiä kieliä typologiaan sopimattomiksi 
(esimerkiksi thai, ks. Slobin 2004; Zlatev & Yangklang 2004). 

Suhteellisen vähän on sen sijaan pohdittu sitä, missä määrin yksittäis- 
kielen sisällä on variaatiota liiketilanteiden? ilmaisussa (ks. kuitenkin 
esimerkiksi Croftin ja muiden [2010] konstruktioihin perustuva typo- 
logia). Yhtä vähän on tutkittu sitä, miten tämä kompleksisen tilanteen 
kielentäminen kehityksellisesti opitaan ja hallitaan. Koska edellä esitetty 
kehityksellisten muuttujien kahtiajako ei ole yksiselitteinen vaan muut- 
tujat voivat jossakin määrin edustaa molempia luokkia, ennen kehityk- 
sellistä tarkastelua muuttujaa on tutkittava sellaisella ikäluokkatasolla, 
jolla hallinnan voidaan olettaa olevan melko ongelmatonta eli aikuis- 
tasolla, ja näin kartoitettava kielennettävään ilmiöön liittyvää variaatiota. 

Spatiaalisten merkitysten jäsentyminen kielelliseksi ilmaisuksi on 
viimeaikaisten tutkimusten valossa monen tekijän summa. Esimerkiksi 
spatiaalisten viitekehysten tutkimuksessa on todettu, että siihen vaikut- 
tavat ainakin kieli ilmaisuvarantoineen, fyysinen ympäristö sekä sosio- 
kulttuuriset tekijät (ks. esimerkiksi Dasen & Mishra 2010; Bohnemeyer 
ja muut 2014; Palmer, Lum, Schlossberg & Gaby 2017). Kielen vaihte- 
levat resurssit mahdollistavat yksilöiden erilaiset valinnat ja niistä synty- 
vän variaation, mutta yksilöiden välillä on myös huomattavia eroja spa- 
tiaalisen kognition tarkkuudessa (ks. esimerkiksi Wolbers & Hegarty 
2010; Meneghetti, Pazzaglia & De Beni 2011), mikä voi näkyä spatiaali- 
sessa kielenkäytössä. 

Suomen kielen liikkeen ilmaisua on tarkasteltu aiemmin lähinnä yksit- 
täisistä muotokeinoista käsin (esimerkiksi Leino, Helasvuo, Lauerma, 
Nikanne & Onikki 1990; Sivonen 2005; Ojutkangas 2003; 2012; Huumo 
2010; Lehismets 2014). Tässä tutkimuksessa näkökulma on ilmiö- 
lähtöinen: aineisto on rajattu visuaalisella elisitaatiokehyksellä ja analy- 
soitu Zlatevin (esimerkiksi 2003; 2007) holistic spatial semantics -teoria- 


22 Käytän tässä yhteydessä liiketapahtuman (motion event, esimerkiksi Talmy 1985; 2000) sijaan käsitettä 
liiketilanne (motion situation, ks. Zlatev, David & Blomberg 2010, 393), koska se viittaa luontevammin 
sekä rajattuihin tapahtumiin että rajaamattomiin aktiviteetteihin (rajattuudesta tarkemmin väylän ja 
suunnan yhteydessä). 

23 Spatiaalisten suhteiden ilmaisuun liittyvä tutkimus on ollut etenkin kognitiivisesti suuntautuneessa 
fennistiikassa runsasta, joten en pyri tässä kattavaan esitykseen vaan mainitsemaan joitakin esimerk- 
kejä. 
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kehyksen eli kokonaisvaltaisten semanttisten kategorioiden avulla, joista 
keskitytään erityisesti liiketilanteen väylään ja suuntaan.” Lähtökohtai- 
sena ajatuksena on, että kielissä on keinot tiettyjen perustavanlaatuisten 
spatiaalisten kategorioiden kielentämiseen mutta ilmaisutavat ja ilmai- 
sun laajuus vaihtelevat kielten resurssien mukaan. 

Tässä yhteydessä tarkasteltavat kielennökset ovat liiketilanteiden ku- 
vauksia, joihin sisältyy translokaatio eli muuttujan paikanmuutos suh- 
teessa spatiaaliseen viitekehykseen, kuten kiintopisteeseen tai puhujan 
näkökulmaan (Zlatev ja muut 2010; tässä seuraava luku). Muuttuja on 
entiteetti, jonka sijainti tai liike on spatiaalisessa ilmauksessa huomion 
kohteena, ja kiintopiste on entiteetti, johon muuttujan sijainti tai liike 
suhteutuu (esimerkiksi Talmy 1975). Muuttujan ja kiintopisteen suhde 
on liikeilmauksessa dynaaminen, ja jos liikettä ei ilmaista, kyseessä on 
staattinen lokaatio. Tässä tarkasteltavana on omavoimainen liike, joka 
tapahtuu ilman ulkopuolista aiheuttajaa (esimerkiksi mennä vs. viedä). 

Tavoitteena on tarkastella spatiaalisesti rajatun väylän ja spatiaalisesti 
rajaamattoman suunnan (Zlatev 2007; ks. myös Miller & Johnson-Laird 
1976) ilmaisukeinoja ja niiden käyttöä liikeilmauksissa. Väylän osalta 
tarkastelen ensisijaisesti sitä, millaisilla kielenyksiköillä suomen puhujat 
ilmaisevat väylän KESKIVAIHETTA (esimerkiksi metsän läpi, tien poikki). 
Lisäksi tarkastelen, millaisiin elisitaatiokehyksessä esitettyihin liiketilan- 
teisiin erityisesti liittyy kielenkäyttäjien välistä variaatiota rajattuuden 
suhteen ja millaisista kielenkäyttäjät ovat yksimielisiä. Kielensisäisen 
variaation näkökulmien rinnalla kulkee typologinen näkökulma: suh- 
teutan tulosten perusteella suomea tarkasteltujen merkityskategorioiden 
osalta Talmyn (2000b) typologiaan sekä muihin liikkeen ilmaisun typo- 
logisessa tarkastelussa esitettyihin yleistyksiin. 


24 Zlatev (2007) käyttää semanttisten kategorioiden merkintätapana isoa alkukirjainta. Tässä yhteydessä 
käytetään kuitenkin suomen konventioiden mukaisesti pientä alkukirjainta kategorioiden nimissä: 
muuttuja (Figure), kiintopiste (Landmark), liike (Motion), väylä (Path), suunta (Direction), viite- 
kehys (Frame of Reference), ala (Region) ja tapa (Manner). Kategorioiden arvot, kuten väylän ALKU, 
KESKIVAIHE ja LOPPU merkitään kapiteeleilla. 

25 Hahmopsykologiaan pohjaavat käsitteet Figure ja Ground on kielitieteessä ottanut käyttöön Talmy 
(1975). Vastaavista merkityskategorioista on käytetty myös käsitepareja referent ja relatum (Miller & 
Johnson-Laird 1976) sekä trajector ja landmark (Langacker 1987). Suomessa vakiintuneimmat termit 
ovat muuttuja ja kiintopiste. 
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Elisitaatiokehystä käytettäessä kiinnostuksen kohteena ovat tyypilli- 
sesti sellaiset kielen piirteet, joista ei voi saada tietoa suoraan kieliopeista 
tai sanakirjoista, ja pyrkimyksenä on yleensä edustavan aineiston saami- 
nen kieltenväliseen vertailuun. On kuitenkin myös tarpeen tarkastella, 
kuinka paljon variaatiota yksittäisen kielen aineisto kätkee sisäänsä ja 
millaiset tekijät sitä aiheuttavat. Riittävän laajalla koehenkilöjoukolla eli- 
sitaatiokehys tuo esiin myös variaation siinä, millaisia resursseja yksit- 
täiskielen puhujayksilöt valitsevat samojen tilanteiden kuvaamiseen. 
Tämän tutkimuksen aineisto on kerätty 50:ltä suomea äidinkielenään 
puhuvalta koehenkilöltä, joista valtaosa on nuoria aikuisia. Kansainväli- 
sessä liikkeen typologiaa kartoittavassa hankkeessa? on kerätty myös 
kehityksellistä aineistoa, ja vastaavasti sitä kerätään myöhemmän kielen- 
kehityksen hankkeessa. Siten tässä esitellyt tulokset nuorten aikuisten 
käyttämistä liikkeen kielentämisen keinoista mahdollistavat myöhem- 
män kehityksellisen näkökulman. Alustava vertailu Unelmakirjoitelma 
-aineistoon (ks. aineistosta Pajusen ja Hongon johdantolukua) osoittaa, 
että vaihtelu lasten ja nuorten aikuisten välillä on odotettavaa myös spa- 
tiaalisten kielenainesten, kuten väylän ja suunnan ilmaisuun käytettyjen 
grammien” osalta. 

Tarkastelu etenee seuraavasti: Seuraavassa luvussa avaan väylän ja 
suunnan käsitteitä ja niiden suhdetta spatiaaliseen rajattuuteen sekä 
esittelen rajanylityksen (boundary-crossing) käsitteen ja siihen liittyvät ty- 
pologiset yleistykset. Kolmannessa luvussa esittelen käytetyn elisitaatio- 
kehyksen ja kuvailen sillä koottua suomen kielen aineistoa. Neljäs luku 
keskittyy väylän KESKIVAIHEEN ja viides suunnan ilmaisukeinoihin ai- 
neistossa. Kuudennessa luvussa tarkastelen tapaustutkimuksen omai- 
sesti väylän KESKIVAIHEESEEN ja suuntaan liittyvää variaatiota sellaisten 
stimulusten kielennöksissä, joissa kiintopiste on ihmiselle tyypillinen 
kulkureitti. Loppuluku kokoaa tarkastelun keskeiset tulokset. 


26 Zlatev, Jordan ja muut: Phenomenology and Typology of Motion (PATOM). 

27 Spatiaaliset kielenainekset ovat tyypillisesti syntaktisesti monifunktioisia: sama yksikkö saattaa toimia 
kontekstista riippuen esimerkiksi adpositiona tai adverbina (luolan sisään vs. sisään luolaan), pre- tai 
postpositiona (pitkin polkua vs. polkua pitkin). Myöskään rajanveto adpositioiden ja relationaalisten 
substantiivien välillä ei ole aina mielekästä. Käytänkin spatiaalisista kieliopillisista sanoista yleisnimi- 
tystä grammi (ks. esimerkiksi Svorou 1994; fennistiikassa esimerkiksi Ojutkangas 2003; 2012). 


LIIKETILANTEEN VÄYLÄN JA SUUNNAN KIELENTÄMINEN SUOMESSA 111 


https://doi.org/10.21435/skst.1472 


Vayla ja suunta 


Liikkeen kielentämisen kuvauksessa väylän (Path) käsite on ollut tärkeä 
lähtökohta. Väylä ilmaisee liikerataa, jolla liike etenee (Talmy 20000). 
Etenevä liike suuntautuu aina jonnekin, ja yleensä on oletettu, että 
suunta sisältyy väylään. Holistinen spatiaalinen semantiikka kuitenkin 
erottaa väylän ja suunnan (Zlatev 2003) ja perustaa eron liikeradan ra- 
jattuuteen. Käsittelen tätä erottelua yksityiskohtaisemmin. 


VÄYLÄ JA SUUNTA RAJATUN JA RAJAAMATTOMAN LIIKERADAN 
ILMENTYMINÄ 

Talmyn (esimerkiksi 1985; 2000b) mukaan keskeinen eronteko maail- 
man kielten välillä on se, millä kielenyksiköllä väylä niissä tyypillisim- 
min ilmaistaan. Talmy (20000) nimittää verbikehyskieliksi (verb-framed 
languages) niitä, jotka tyypillisesti ilmaisevat väylän pääverbissä (esimer- 
kiksi romaaniset ja seemiläiset kielet) ja satelliittikehyskieliksi (satellite- 
framed languages) niitä, joissa väylän ilmaisemiseen käytetään useim- 
miten verbiin yhteydessä olevaa niin sanottua satelliittia, kuten verbiin 
liittyvää partikkelia tai verbiprefiksiä (esimerkiksi germaaniset ja slaavi- 
laiset kielet). Satelliittikehyskielissä liikeverbi ilmaisee tyypillisesti ta- 
van (esimerkiksi kävellä, juosta). Suomalais-ugrilaiset kielet edustavat 
Talmyn (2000b, 60) mukaan satelliittikehyskieliä, mutta kattavaa empii- 
ristä kartoitusta suomen ilmaisukeinoista ei ole toistaiseksi tehty. Lisäk- 
si satelliitin käsitteen soveltuvuutta sijakieliin on kyseenalaistettu (ks. 
esimerkiksi Imbert, Grinewald & Sörés 2011; Naidu, Zlatev, Duggirala, 
Van De Weijer, Devylder & Blomberg 2018). 

Talmyn (2000b) teoriassa väylä (Path) on jokaisen spatiaalista siirty- 
mää ilmaisevan lauseen ydinskeema (core schema). Talmyn väylän käsi- 
tettä on kritisoitu siitä, että se on liian laaja ja häivyttää liiketilanteiden 
keskeisiä erontekoja, kuten liikkeen rajattuuden (boundedness) ja rajaa- 
mattomuuden (unboundedness) (ks. esimerkiksi Zlatev ja muut 2010; 
Blomberg 2014, 67-68, 74-76). Zlatev (esimerkiksi 2003; Zlatev ja 
muut 2010) onkin erottanut väylän (Path) ja suunnan (Direction) käsit- 
teet jäsentääkseen rajattuuden ja rajaamattomuuden vaihtelua. Väylä 
ja suunta ovat liikeradan ilmentymiä, jotka eroavat toisistaan rajattuu- 
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den kannalta.” Skemaattisesti määritelty väylä koostuu ALUSTA, KESKI- 
VAIHEESTA ja LOPUSTA (esimerkki 1), jotka kielissä tyypillisesti erotetaan 
omilla keinoillaan ilmaistaviksi vaiheiksi ja joista voidaan ilmaista ker- 
rallaan yksi tai useampia. Rajatussa liiketilanteessa muuttuja käy läpi 
tilanmuutoksen suhteessa yhteen tai useampaan väylän vaiheeseen. 
(Zlatev ja muut 2010, 395—396.) Rajattu liiketilanne vastaa Vendlerin 
(1967) teelistä eli päätepisteeseen johtavaa suoritusta (accomplishment). 
Sen sijaan rajaamattomassa liiketilanteessa ei implikoida tilanmuutosta 
vaan liike voisi periaatteessa jatkua loputtomiin (vaikka käytäntö lopulta 
asettaakin rajansa), ja tällöin on pikemminkin kyse liikkeen suunnasta 
(esimerkki 2) (Zlatev ja muut 2010, 395—396). 


1) Väylän vaiheet: Tyttö kävelee puistosta [ALKU] tien yli [KEsKIvAIHE] 
kirjastolle [Loppu]. 
2) Suunta: Tyttö kävelee tieltä päin pihaa pitkin kohti kirjastoa. 


Esimerkkien 1 ja 2 liiketilanteet ovat translokatiivisia, eli ne ilmaisevat 
siirtymän suhteessa spatiaaliseen viitekehykseen (Frame of Reference): 
muuttuja liikkuu suhteessa erilaisiin kiintopisteisiin (objektikeskeinen, 
ks. esimerkiksi 1 ja 2), tilanteen havainnoijan tai muun osallistujan 
näkökulmaan (näkökulmakeskeinen, esimerkiksi Tyttö tulee puistosta) 
ja/tai elinympäristön määrittämiin kiinteisiin suuntiin (geosentrinen, 
esimerkiksi Tyttö kävelee pohjoiseen /ylöspäin) (Zlatev ja muut 2010, 394- 
395; Tuuri, tulossa). Esimerkin 3 kaltaiset lokaation ilmaukset eivät liike- 
verbistä huolimatta konstruoinnin kannalta sisällä translokaatiota, eli 
paikanmuutosta ei kielennetä. Vendlerin (1967) luokituksessa tällaiset 
ilmaukset edustavat rajaamattomien liiketilanteiden tapaan aktiviteettia 
(activity). Erona rajaamattomiin liiketilanteisiin on se, että suuntaa ei 
ilmaista (jatkuvuus on kuitenkin merkityksestä pääteltävissä). Zlatev, 
David & Blomberg (2010) katsovat lokaation ilmausten edustavan väylän 
nolla-arvoa, PAIKKAA. 


28 Liikeilmausten rajattuuden analyysissä keskitytään spatiaaliseen ulottuvuuteen, mutta sitä on vaikea 
täysin erottaa liikkeeseen väistämättä liittyvästä ajallisesta ulottuvuudesta ja aspektista, jonka kuvauk- 
sessa rajattuuden käsitettä on pääasiassa käytetty (ks. esimerkiksi Heinämäki 1984; Nurminen 2015). 

29 Esimerkit, joista puuttuu aineistoviittaus, ovat itse koostettuja. 
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3) Tyttö kävelee puistossa. 


Liikkeen tiettyyn lokaatioon sijoittavat PAIKKA-ilmaukset muodostavat ra- 
jattuuden kannalta erikoistapauksen: liikkeen voi nähdä rajattuna siinä 
mielessä, että se tapahtuu kokonaan kiintopisteen muodostaman alueen 
sisällä. Kiintopisteen sisällä kuljettu liikerata jää kuitenkin rajoiltaan 
avoimeksi. Esimerkin 4 lauseista 4a jättää liikeradan avoimimmaksi 
siinä mielessä, että periaatteessa se ei kerro mitään miehen etenemis- 
tavasta sillan muodostaman kiintopisteen rajojen sisäpuolella, vaikka 
maailmantiedon perusteella oletus onkin, että mies kulkee sillan kulku- 
suunnan mukaisesti eikä esimerkiksi askella edestakaisin sillan kaiteelta 
toiselle. Lause 4b ilmaisee rajatun väylän ja määrittelee sen ulottuvan 
sillan alusta loppuun, kun taas 4c jättää liikeradan rajaamattomaksi 
mutta eksplikoi kuitenkin liikkeen sillan kulkusuunnan mukaiseksi eli 
ilmaisee suunnan. 


4a) PAIKKA: Mies kävelee sillalla. 
4b) Rajattu: Mies kävelee sillan yli. 
4c) Rajaamaton: Mies kävelee siltaa pitkin. 


Keskeinen teoreettinen lähtökohta tässä luvussa esittämässäni rajattuu- 
den analyysissä on spatiaalisen merkityksen holistisuus (esimerkiksi 
Zlatev 2003): spatiaalisen siirtymän ilmaisu ei asemoidu lauseissa 
useinkaan yksittäisen kielenyksikön ilmaistavaksi vaan jakaantuu eri kie- 
lenyksiköiden, niin kieliopillisten kuin leksikaalistenkin, ilmaistavaksi. 
Tähän liittyy läheisesti semanttisen distribuution (Sinha & Kuteva 1995) 
käsite. Sillä viitataan yhden merkityksen toistumiseen useassa muodos- 
sa (esimerkiksi sisään taloon) ja spatiaalisen merkityksen jakautumiseen 
kieliopillisten ja leksikaalisten elementtien kesken (esimerkiksi spatiaa- 
lisen relaation erilaisuus saman sijamuodon sisältävissä lauseissa Taulu 
on seinällä ja Taulu on pöydällä, siis kiintopisteen vaikutus merkityksen 
muodostumisessa). 

Hyödynnän semanttisessa analyysissä myös semanttisen granulari- 
teetin eli yksityiskohtaisuuden käsitettä. Sovellan van Stadenin ja Narasim- 
hanin (2012) erottamia granulariteetin tasoja ja tarkastelen ensinnäkin, 
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miten videolla näkyvä tilanne segmentoidaan (mitä videolla esiintyvistä 
elementeistä kielennetään) ja toisekseen, millaisin keinoin ja kuinka spe- 
sifisti spatiaalisia merkityksiä ilmaistaan. Kehityksellisesti sekä holisti- 
suus että granulariteetti ovat oletettavasti haasteellisia, koska ne edellyttä- 
vät objektien ominaisuuksien ja sanojen merkityksen tarkkaa hallintaa. 


RAJANYLITYS 

Rajatuista liiketilanteista voidaan erottaa alatyypiksi ne, joissa ylitetään 
spatiaalinen raja. Liikkeen kielentämistapojen kieltenvälisen variaation 
tarkastelun kannalta keskeinen on ollut Asken (1989) havainto, että 
Talmyn leksikalisointityyppeihin erottamat kielet eroavat toisistaan ensi- 
sijaisesti teelisten eli päätepisteen tai tuloksen ilmaisevien lauseiden 
osalta. Slobin ja Hoiting (1994) muotoilevat saman periaatteen siten, 
että niin sanottu väyläverbi tarvitaan verbikehyskielissä nimenomaan 
ilmauksiin, joissa ylitetään spatiaalinen raja. Raja ymmärretään laajasti: 
se kattaa sekä siirtymät ulos rajatusta tilasta (väylän ALUSSA, esimerkki 
5a) tai rajatun tilan sisään (väylän Lopussa, esimerkki 5b) että linjamai- 
sen rajan ylityksen tai laajemman alueen poikki kulkemisen (väylän 
KESKIVAIHEESSA, esimerkki 5c). 3° 


5a) Hän astuu ulos talosta. 
5b) Bussi ajaa tunneliin. 
5c) Koira loikkaa aidan yli/juoksee pihan poikki. 


Esimerkiksi verbikehyskieleksi määritellyssä ranskassa taloon juoksemi- 
nen ilmaistaan pääsääntöisesti väyläverbillä, kuten entrer ’menni sisään’, 
ja tapa voidaan ilmaista infiniittisellä rakenteella, jos se katsotaan tar- 
peelliseksi (L'homme est entre dans la maison [en courant]. ’ Mies meni 
[juosten] sisään taloon”), kun taas talolle asti juoksemisen, johon ei si- 
sally rajanylitystä, voi ilmaista tapaverbillä (L'homme a couru jusqu’a la 
maison. Mies juoksi talolle saakka”) (Slobin & Hoiting 1994, 496). 


30 Grammit pois ja ulos ovat muodoltaan tulosijaisia, mutta niiden merkityksessä keskeistä ei ole pääte- 
pisteen ilmaisu vaan katson niiden korostavan siirtymää väylän ALUSSA. Päätepiste eli väylän LOPPU 
jää avoimeksi, ja se voidaan ilmaista erikseen, kuten lauseessa Poika tulee ulos luolasta merenrantaan, 
jossa ulos luolasta on väylän ALUN ilmaus ja merenrantaan väylän LOPUN. 
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Tämä verbikehyskieliin liittyvä ilmiö tunnetaan kirjallisuudessa nykyi- 
sin nimellä boundary-crossing constraint, jonka suomennan tässä rajanyli- 
tysrajoitteeksi. Slobinin (2004, 226—227) mukaan verbikehyskielissä on 
taipumus ilmaista nimenomaan verbilla teelistä tilanmuutosta, jollainen 
rajanylitys keskeisesti on. Tapaverbien ilmaisema liike edustaa pikem- 
minkin aktiviteettia (Vendler 1967, 107), eivätkä tapaverbit siten kovin 
luontevasti sovellu näissä kielissä rajanylityksen ilmaisuun. Satelliitti- 
kehyskielissä, joissa rajanylitys tulee tyypillisesti ilmaistuksi muualla 
kuin pääverbissä, mainitut tekijät yhdistyvät ongelmattomasti. 

Viimeaikaiset tutkimukset viittaavat kuitenkin siihen, että ilmiössä on 
kyse pikemminkin tendensseistä kuin varsinaisesta rajoitteesta. Tyypilli- 
sissä verbikehyskielissä tapaverbien käyttöä on havaittu liittyvän erityi- 
sesti nopeisiin, yhtäkkisiin siirtymiin, kuten veteen hyppäämiseen, ja 
toisaalta väylän KESKIVAIHEESSA tapahtuviin ylityksiin (ks. esimerkiksi 
Özcaliskan 2015 turkista). Kopeckan (2009) mukaan ranskassa tapa- 
verbien ja lokatiivisten adpositioiden yhdistelmiä esiintyy rajanylitys- 
konteksteissa enemmän kuin on oletettu ja ilmiöön liittyy monitahoista 
tilanteista vaihtelua. Rajanylitysilmausten tarkempi analyysi yksittäis- 
kielissä on siis tarpeen. 

Suomen kielessä spatiaalisten rajojen ylittämisen ilmauksiin ei liity 
rajoitteita verbikehyskielten tapaan, mutta suomessa on käytössä sekä 
satelliitti- että verbikehyskielille tyypillisiä strategioita rajanylitysten il- 
maisuun ja rajanylitysten ilmaisu tuottaa aineistoon variaatiota, kuten 
myöhemmin tulee tarkemmin ilmi. 


Elisitaatiokehyksellä koottu aineisto 


Strukturoidun elisitaation perustana on elisitaatiokehys (elicitation grid), 
sarja ei-kielellisiä stimuluksia, joilla tähdätään tietyn aihealueen ilmaisu- 
tapojen ja niissä esiintyvien hienovaraistenkin erojen tavoittamiseen (ks. 
esimerkiksi Levinson ja muut 2003). Metodin ilmeisin hyöty on se, että 
samojen stimulusten käyttö mahdollistaa variaation systemaattisen tar- 
kastelun niin kielten kuin yksilöidenkin välillä. Stimulusten avulla rajaa- 
malla pyritään saamaan mahdollisimman yhteismitallista ja vertailu- 
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kelpoista aineistoa. Luonnollisesti elisitaatiokehysten on oltava huolelli- 
sesti suunniteltuja, koska metodilla saadaan kielestä esiin juuri niitä 
piirteitä, joihin kehys ohjaa. On varmistuttava rajausten mielekkyydestä 
ja mahdollisesti täydennettävä tarkastelua esimerkiksi korpusaineistoil- 
la. Huomioitava on myös koehenkilömäärän vaikutus: kielelle tyypillistä 
ilmaisutapaa voi tuskin päätellä muutaman koehenkilön aineistosta. Eli- 
sitaatio vertautuu yksilöllisiä reaktioita tuottavaan projektiiviseen testiin, 
joka mittaa normittamatonta, tyypillistä käyttäytymistä laatuasteikolla 
ja jossa valmista vertailukohtaa ei ole olemassa tai maksimaalista suo- 
ritusta määritelty. 

Liikkeen leksikalisoinnin kieltenvälisessä tutkimuksessa on laajasti 
käytetty kuvien selostamiseen perustuvaa elisitaatiota; tunnetuimpana 
esimerkkinä ovat Frog, where are you? -kuvakertomuksella (Mayer 1969) 
koottuihin aineistoihin perustuvat tutkimukset (ks. esimerkiksi Berman 
& Slobin 1994; Strömgvist & Verhoeven 2004). Liikeilmausten aineis- 
tonkeruuseen video on kuitenkin havainnollisuudessaan luontevampi 
formaatti. Tässä tutkimuksessa liikeilmausten aineistonkeruuseen käy- 
tettiin Trajectoire-videosarjaa (Ishibashi, Kopecka & Vuillermet 2006), 
jolla on kerätty aineistoa kymmenistä eri kielistä. Trajectoire koostuu 
76 videoklipistä, joista 55 esittää varsinaisen liiketilanteen, kaksi on teh- 
tävänannon yhteydessä katsottuja harjoitusvideoita ja loput ovat ”fillerei- 
tä” eli mukana tutkimuksen tarkoituksen hämärtämiseksi. Videot ovat 
8—14 sekuntia pitkiä, ja niissä on näyteltyjä liiketilanteita vaihtelevissa 
luonnonympäristöissä. 

Videoissa vaihtelevat perusmuuttujat ovat muuttuja (näyttelijät ovat 
naisia, miehiä ja lapsia, jotka esiintyvät joko yksittäin tai ryhminä), eri- 
laiset kiintopisteet (esimerkiksi tie, metsä, luola tai meri) ja muuttujien 
erityyppiset liikeradat suhteessa kiintopisteisiin (esimerkiksi sisään tai 
ulos jostakin siirtyminen tai läpi kulkeminen). Trajectoire-kehys on kehi- 
tetty ensisijaisesti rajattujen liiketilanteiden tarkasteluun. Mukana on 
myös rajaamattomia liiketilanteita esittäviä videoita sekä rajattuuden 
suhteen monitulkintaisia videoita. Liikeradat vaihtelevat myös komplek- 
sisuudeltaan hyvin yksinkertaisesta muutaman erilaisen vaiheen sisältä- 
vään (esimerkiksi polkua pitkin kävely ja astuminen sisään polun päässä 
olevaan luolaan). Videoissa liikutaan pääasiassa kolmella tavalla: kävel- 
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len, juosten ja hypäten. Elisitaatiokehyksen sisältöä erittelevät tarkem- 
min Kopecka ja Ishibashi (2011). 

Visuaalisessa virikemateriaalissa on väistämättä muuttujana myös 
kuvakulma, ja on huomioitava myös sen mahdolliset vaikutukset kie- 
lennöksiin. Trajectoire-kehyksessä pääkuvakulmat ovat sivusta (muuttuja 
liikkuu kameran ohitse oikealle tai vasemmalle, n = 20), edestä (muut- 
tuja liikkuu kameraa kohti, n = 12) ja takaa (muuttuja liikkuu kame- 
rasta poispäin, n = 15). Osassa videoista kuvakulma ei ole aivan yksi- 
selitteinen, vaan ne on kuvattu joko hiukan viistosta tai niillä näkyvään 
liikkeeseen sisältyy muuttujan käännös. Nämä videot olen määritellyt 
yhdistelmiksi sivusta/edestä (n = 4), sivusta/takaa (n = 3) ja edestä/takaa 
(n = 1). 

Suomen aineisto on kerätty 50 suomenkieliseltä aikuiselta vuosina 
2013—2015. Kukin koehenkilö katsoi Trajectoire-videosarjan yksi video 
kerrallaan, ja aina yhden videon katsottuaan koehenkilö kielensi lyhyesti 
näkemänsä eli vastasi kysymykseen ”Mitä videossa tapahtui?”. Videoista 
käytettiin kolmea erilaista esitysjärjestystä, jotta videoiden järjestyksen 
mahdollisia vaikutuksia kielennöksiin saataisiin vähennettyä. Keski- 
määräinen yhden koehenkilön tuottama sanamäärä on noin 453, ja koe- 
henkilöiden tuotteliaisuus vaihteli suuresti: pienin sanamäärä on 254 ja 
suurin 1283. 

Koehenkilöille annettiin ohje lyhyistä, yksilauseisista kielennöksistä, 
ja 90,3 prosenttia kielennöksistä sisältääkin vain yhden liiketilannetta 
kuvaavan lauseen (ks. taulukko 14). Aineistossa on myös 7,4 prosenttia 
kahden liikelauseen ilmauksia (esimerkki 6) ja 1,1 prosenttia kolmen 
liikelauseen ilmauksia (esimerkki 7). 


6) Nainen tuli luolasta ja käveli polkua pitkin. (trFittr7-023)* 
7) Poika juoksee hiekalla ja hyppää ison kiven yli ja tulee kohti kame- 
raa. (trFi#18-063) 


31 Suluissa olevat aineistoviittaukset esitetään kansainvälisen Trajectoire-projektin yhtenäistä mallia mu- 
kaillen sisällyttäen seuraavat tiedot: viittaus aineistonkeruutyökaluun (tr = Trajectoire), kielen koodi 
(Fi = suomi), koehenkilön tunnistenumero ja viimeisenä kielennöksessä kuvaillun videon numero. 
Esimerkeistä on lihavoitu kulloinkin tarkastellut tai tulkinnan kannalta erityisen keskeiset kielenyksiköt. 
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Aineistossa ovat mukana ne liikevideoiden kielennökset, joissa on mu- 
kana translokaatiota eli muuttujan liike suhteutuu johonkin spatiaali- 
seen viitekehykseen, tyypillisimmin kiintopisteeseen tai katsojan näkö- 
kulmaan. Tarkastelun ulkopuolelle rajattuja tapauksia ovat paitsi täysin 
muuhun kuin liikkeeseen keskittyvät kielennökset (esimerkiksi Suku- 
kokous lammen rannalla) myös kielennökset, joissa ilmaistaan pelkästään 
muuttujan liike (ja korkeintaan tapa) ilman spatiaalista kehystämistä 
(esimerkiksi Nainen kävelee). Näitä tapauksia edustaa 1,2 prosenttia kie- 
lennöksistä. 


Taulukko 14. Liikelauseiden määrä aineiston kielennöksissä (n = 2740). 


Liikelauseita / kielennös Kielennökset % 
o 1,2 
I 90,3 
2 74 
3 LI 


Koehenkilöiden mediaani-ikä aineistonkeruuhetkellä oli 26, ja valtaosa 
heistä on nuoria aikuisia, pääasiassa eri alojen korkeakouluopiskelijoita. 
Koehenkilöistä 33 on naisia ja 17 miehiä. Aineistonkeruutilanteet videoi- 
tiin, litteroitiin standardiortografialla ja annotoitiin ELAN-ohjelmalla 
(Sloetjes & Wittenburg 2008). Koko aineisto koostuu 2 740 kielennökses- 
tä, joissa on yhteensä 16 889 sanaa (filleri- ja harjoitusvideot on poistettu 
tästä aineistosta). Aineisto on analysoitu kahtena eri versiona: morfolo- 
gisesti ja semanttisesti sana kerrallaan sekä semanttisesti kokonaisina 
kielennöksinä. Molempia aineistoversioita on käytetty tarkastelussa 
tutkimuskysymysten mukaan. Seuraavissa luvuissa tarkastellaan koko 
aineistosta poimittuja väylän KESKIVAIHEEN ja suunnan ilmauksia ja 
ilmaisukeinoja ja lopuksi tarkastelua rajataan tiettyjen videoiden kie- 
lennöksiin, toisinaan koko translokatiivisten liikeilmausten aineistoon 
tai muuntyyppisiin videoihin suhteuttaen. 
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Väylän KESKIVAIHEEN kielentämisen keinot 


Väylän KESKIVAIHEEN ilmaisukeinojen variaatio on suomessa runsasta, 
ja tässä luvussa esittelen aineistossa esiintyvät suomen kielen resurssit, 
joilla voidaan ilmaista väylän KESKIVAIHETTA. Keskeisimmäksi ilmaisu- 
keinoksi erottuu laaja joukko grammeja. Suomen väylän KESKIVAIHEEN 
(reitin) grammeja on aiemmassa tutkimuksessa tarkasteltu muun muas- 
sa yksittäisten adpositioiden merkityksiin keskittyen (esimerkiksi Salmi 
1994; Seppälä 2010), muutamaa grammia vertaillen (esimerkiksi Lehis- 
mets 2014) sekä grammien syntaktiseen asemaan liittyviä merkityseroja 
tarkastellen (esimerkiksi Huumo 2010). Taulukossa 15 on esitetty tämän 
tutkimuksen aineistossa esiintyvät väylän KESKIVAIHEEN grammit frek- 
vensseineen. Vasemmassa sarakkeessa ovat grammit, joilla väylän KESKI- 
VAIHE kuvataan joko kiintopisteen laidalta toiselle ulottumiseksi tai kiin- 
topisteen läpäisemiseksi, jotka edustavat tyypillisesti rajanylityksiksi?? 
tulkittavia merkityksiä. Oikeassa sarakkeessa ovat grammit, joilla kuva- 
taan kiintopistettä hetkellisesti sivuavaa väylää, siis vähemmän proto- 
tyyppisesti rajanylityksiksi mieltyviä ohituksia. Grammit yli (n = 305)% ja 
ylitse (n = 15) voivat ilmaista kumpaakin merkitystyyppiä riippuen siitä, 
millaisen kiintopisteen yhteydessä ne esiintyvät: esimerkissä 8 yli kuvaa 
kiintopisteen päästä päähän ulottuvaa väylää ja esimerkissä 9 pikem- 
minkin pistemäisesti kiintopistettä sivuavaa väylää. 


8) Nainen kävelee nurmikentän yli. (trFi#23-051) 
9) Poika hyppää hietikolla kiven yli. (trFi##4-063) 


32 Rajanylityksen määrittely kirjallisuudessa on vaihtelevaa. Esimerkiksi Egan ja Graedler (2015) käsitte- 
levät rajanylityksenä vain kolmiulotteisia ulos- ja sisään-tyyppejä. Arkikielessä raja taas mieltyy pikem- 
minkin kaksiulotteiseksi, ja myös oletus rajan lineaarisuudesta nousee keskeiseksi (ks. esimerkiksi 
Kielitoimiston sanakirja (2018), jossa rajan määrittelyssä käytetään muun muassa sanoja linja, ääriviiva 
ja reuna). Esimerkiksi Özcaliskanilla (2015) väylän KESKIVAIHEEN rajanylitys on mukana analyysissä, 
mutta esimerkit edustavat vain melko prototyyppisiä tapauksia eli lineaaristen objektien ylittämistä 
(esimerkiksi aidan yli hyppääminen) tai alueen päästä päähän kulkemista (esimerkiksi maton yli ryö- 
miminen). On avoin kysymys, missä määrin esimerkiksi ohitukset ovat samaistettavissa ylityksiin. 

33 Jatkossa kielenyksikön frekvenssi aineistossa ilmaistaan tällä tavalla ensimaininnan yhteydessä. 
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Taulukko 15. Aineistossa esiintyvät väylän KESKIVAIHEEN grammit frekvensseineen. 


Poikki-tyyppi Ohi-tyyppi 
poikki (139) ohi (302) 
läpi (13) takaa (66) 
halki (12) ohitse (32) 
välistä (6) editse (20) 
kautta (5) edestä (19) 
keskeltä (1) taitse (3) 
lomitse (1) vierestä (1) 
yli (305) 


ylitse (15) 


Grammin yli esimerkin 8 mukaista ”päästä päähän’ -merkitystä edusta- 
vat myös poikki (n = 139) (esimerkki 10) ja harvakäyttöisempi halki 
(n = 12) (esimerkki 11). Yksittäisissä kielennöksissä vastaavaa merkitystä 
ilmaistaan myös läpi-grammilla (n = 13) (esimerkki 12). 


10) Nainen kävelee varjoisan pihan poikki. (trFi#20-051) 
11) Nainen kävelee nurmikon halki kohti puita. (trFi#9-039) 
12) Nainen kävelee puiston läpi metsään. (trFi#13-057) 


Grammi läpi on kuitenkin tyypillisempi voimadynaamisessa esteen lä- 
päisemisen merkityksessään (esimerkki 13) (ks. Lehismets 2013). 


13) Mies kävelee puskien läpi metsään. (trFi#33-026) 


Aineisto ei huomattavien frekvenssierojen vuoksi mahdollista väylän 
KESKIVAIHEEN grammien laajempaa semanttista vertailua, mutta jo pinta- 
puolinen katsaus osoittaa, etteivät merkitykset ole selvärajaisia. 
Grammien semanttinen erityispiirre on alan (Region) tarkka spesi- 
fiointi väylän ilmaisun ohella (ks. esimerkiksi Zlatev 2007; Svorou 
1994). Ala on topologista relaatiota tarkentava kategoria muuttujan ja 
kiintopisteen välillä: se ilmaisee, mihin osaan kiintopistettä tai sitä ym- 
päröivää tilaa muuttujan liike tarkalleen kohdistuu. Esimerkiksi ohitus- 
ten kuvaamiseen käytetään paljon grammeja ohi (n = 302) ja ohitse 
(n = 32), mutta lisäksi ohituksen merkitys yhdistyy merkityksiin edessä" 
ja takana’ grammeissa edestä (n = 19), editse (n = 20), takaa (n = 66) 
ja taitse (n = 3). Esimerkin 14 takaa ilmaisee väylän KESKIVAIHEEN ja 
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tarkentaa muuttujan mies ja kiintopisteen puu relaatiota kahdella alan 
arvolla, jotka ilmaisevat lateraalista vierekkäisyyttä ja takana olemista. 


14) Mies kävelee suuren puun takaa. (trFi#8-039) 
väylä: KESKIVAIHE 
ala: SIVU+TAKAOSA 


Edellisten lisäksi harvakseltaan käytettyjä, merkitykseltään spesifejä 
väylän KESKIVAIHEEN grammeja aineistossa ovat välistä (n = 6), kautta 
(n = 5), keskeltä (n = 1), vierestä (n = 1) ja lomitse (n = 1). 

Adnominaaleihin liittyvää väylän ilmaisua useista typologisesti erilai- 
sista kielistä vertaava Papahagi (2011, 124) toteaa, että väylän KESKIVAI- 
HEEN ilmaisu adnominaalein on semanttiselta granulariteetiltaan 
tyypillisesti niukempaa kuin väylän ALUN ja LOPUN: jos kielessä on yksin- 
kertaisia adnominaaleja KESKIVAIHEEN ilmaisuun, ne ovat yleensä hyvin 
yleismerkityksisiä. Esimerkiksi semanttisesti väljästä väylän KESKIVAI- 
HEEN adnominaalista käy ranskan adpositio par, joka voi kontekstista 
riippuen vastata useita suomen grammeja, kuten kautta, läpi, halki, pit- 
kin ja jopa kohti. Suhteellisen runsasta väylän KESKIVAIHEEN ilmaisu on 
Papahagin (2011, 123 ja 125) mukaan romaniassa, mutta siinäkin osa 
muodoista lankeaa yhteen lokaation ilmaisun kanssa. Suomi muodostaa 
siis poikkeuksen Papahagin yleistykseen: väylän KESKIVAIHE eroaa kyllä 
suomessa väylän ALUSTA ja LOPUSTA, mutta erona ei ole ilmaisun pieni 
vaan pikemminkin suuri granulariteetti. 

Koska väylän KESKIVAIHE on granulariteetiltaan korkea ja tulee yleen- 
sä ottaen ilmaistuksi harvemmin kuin väylän ALKU ja Loppu (ks. esi- 
merkiksi Talmy 2000a, 270),3* on oletettavaa, että se tarkentuu lasten 
kielenkäytössä verrattain hitaasti. Tähän viittaa myös elisitoidun aineis- 
ton vertailu Koulu- ja Unelmakorpukseen (ks. Pajunen, Puranen & Yli- 
Paavola 2010; Pajunen 2016; ks. myös Pajusen ja Hongon johdannon 
aineistoesittelyä). Elisitoidussa aineistossa käytetyistä 16 väylägrammista 


34 Talmyn mukaan liikettä ilmaistaessa tyypillisesti ikkunoidaan eli nostetaan huomion kohteeksi ja siten 
myös kielennetään alku- ja päätepiste, kun taas niiden välille jäävät liikeradan vaiheet jäävät helpom- 
min spesifioimatta (medial gapping). Suomessa Talmyn (2000a) huomion ikkunoinnin (windowing of 
attention) käsitettä on soveltanut väylän analyysiin esimerkiksi Ojutkangas (2003; 2012). 
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kuusi on käytössä alakoulun luokilla 1.-5. (halki, kautta, läpi, ohi, poikki, 
yli), 13 on käytössä myös nuorten aikuisten kirjoitelma-aineistossa, ja yh- 
deksän väylägrammin (halki, läpi, kautta, keskeltä, takaa, vierestä, lomitse, 
ohitse sekä ylitse) käyttö lisääntyy iän myötä eli on runsaampaa nuorilla 
aikuisilla kuin alakoululaisilla tai yhdeksäsluokkalaisilla.5 Grammien 
käyttö kasvaa siitä huolimatta, että juuri nuoremmat kirjoittajat kuvaavat 
teksteissään usein hyvin konkreettisesti päivän etenemistä aamusta il- 
taan ja liikkumista eri paikkojen välillä. Ylipäätään aikuisten aineistossa 
väylägrammeja on käytössä monipuolisemmin kuin kouluikäisten ai- 
neistossa; samasta ilmiöstä kertoo Pajusen ja Hongon tässä kirjassa 
osoittama yleinen leksikaalisen diversiteetin kasvu iän myötä. 

Väylän KESKIVAIHEEN sijailmaisu on suomessa suhteellisen vähäistä. 
Aineistossa esiintyy harvakseltaan väylän KESKIVAIHEEN ilmaisuna elatii- 
vi (n = 6), jota voidaan käyttää läpi kuljettavan kiintopisteen yhteydessä, 
kuten esimerkissä 15. Tämä käyttö on rajoittunutta, koska semanttisesti 
hyväksyttävien kiintopisteiden joukko on pieni (Lauerma 1990, 134). Ai- 
neistossa elatiivilla ilmaistun väylän KESKIVAIHEEN kiintopisteinä esiin- 
tyvät reikä, (luolan) suuaukko ja kallionhalkeama. Elatiivi näkyy väylän 
KESKIVAIHEEN ilmaisussa myös grammien (esimerkiksi välistä) muo- 
dostuskeinona. 


15) Nainen meni aidassa olevasta reiästä. (trFi#16-057) 


Toinen KESKIVAIHEEN ilmaisuun liittyvä sija, prolatiivi, sen sijaan tulee 
aineistossa esiin ainoastaan grammien (esimerkiksi ylitse, taitse, lomitse) 
osana. Sillä ilmaistaankin tyypillisesti välillisempää väylää kuin elisitaa- 
tiomateriaalin omavoimaista liikettä edustavissa liiketilanteissa on: esi- 
merkiksi sanomalehtikorpuksessa (Pajunen & Virtanen 2002) prolatiivi 
esiintyy 1400 kertaa ja 82 eri lekseemin yhteydessä, mutta joukossa ei 
väylägrammien lisäksi juuri ole inhimillisen muuttujan omavoimaiseen 


35 Vain grammit läpi, ohi ja yli ovat nuorimmilla yksittäisiä tapauksia yleisempiä. Monia käytetään vielä 
hieman poikkeuksellisesti (esimerkiksi Ja [haluaisin] matkustaa maapalloin yli, 3M70) tai pelkkää suun- 
taa ilmaisten. On ylipäätään yleistä, että nuorimmat kirjoittajat ilmaisevat spatiaalisessa kontekstissa 
vain suunnan tai väylän Lopun. Viljasen (2012) mukaan 8-vuotiaat rajaavat väylän Lopun suhteen tai 
jättävät liikeradan rajaamatta, 9-vuotiailla mukaan tulee myös ALUN suhteen rajattuja väyliä. 
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liikkeeseen soveltuvia väyliä. Sen sijaan prolatiivi on korpuksessa frek- 
ventein välineen ilmaisimena (esimerkiksi puhelimitse, postitse). Toinen 
keskeinen käyttöalue on laajojen, tyypillisesti kulkuvälinein kuljettavien 
reittien ilmaisu (esimerkiksi rautateitse, ilmateitse). 

Väylän KESKIVAIHETTA voi suomessa ilmaista myös verbeillä. Aineis- 
tossa esiintyvät ylittää (n = 62), ohittaa (n = 38) ja alittaa (n = 1) ovat suo- 
men selkeimpiä väyläleksikalisoivia verbejä, koska ne voivat ilmaista yk- 
sinään koko väyläinformaation eikä ilmaisu jakaudu välttämättä verbin 
lisäksi sijaan tai adpositioon, kuten väylän ALKUA ja LOPPUA ilmaisevien 
verbien kohdalla tapahtuu (ylittää tie vs. poistua luolasta, saapua luolaan) 
(Pajunen 2001, 192). Typologiselta kannalta on huomionarvoista, että 
suomen kielessä ylipäätään on lainaamattomia väyläverbejä — esimer- 
kiksi germaanisissa kielissähän ne ovat tyypillisesti lainaa romaanisista 
kielistä, kuten englannin cross, enter ja exit. Frekvenssiltään väyläverbit 
ovat kuitenkin tässä aineistossa verrattain pieniä, kuten jäljempänä kaa- 
viosta 10 sekä taulukosta 16 käy ilmi. 

Väylän KESKIVAIHEEN ilmaisu voi suomessa yhdistyä myös kiintopis- 
teen ilmaisuun. Näin käy esimerkkien 16 ja 17 kaltaisissa tilanteissa, 
joissa kiintopisteenä on muuttujan kulkema reitti. Suomen kielen typo- 
loginen erityispiirre on rajattuuden ilmaisu objektin sijanmerkinnällä: to- 
taaliobjekti (portaat) määrittää liiketilanteen rajatuksi, kun taas partitiivi- 
objekti (portaita) tuo mukanaan rajattomuustulkinnan (ks. esimerkiksi 
Heinämäki 1984).3* Näissä tapauksissa rajaa aspektin ja spatiaalisen ra- 
jattuuden välille on jokseenkin keinotekoista vetää. 


16) Nainen nousi portaat. (trFi#16-029) 
17) Nainen nousi portaita. (trFi#43-074) 


Partitiiviobjektilla ilmaistuun rajaamattomaan liikerataan liittyy suomen 


aineistossa myös grammeja: pitkin (n = 286) ja sen murteellinen variantti 
pisin (n = 8) sekä myöten (n = 6) ja myöden (n = 1), joiden täydennyksenä 


36 Kyseisten muotojen asettumisesta objektin ja adverbiaalin välimaastoon ks. esimerkiksi Leino (1991, 
63-65). 
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partitiivi toimii.” Zlatev, David ja Blomberg (2010, 396) määrittelevät 
along-tyyppiset rajaamattomat liikeradat osaksi suunnan ilmaisua, koska 
väylän ja suunnan keskeinen ero on juuri rajattuudessa. Vektoriksi kuva- 
tun suunnan käsite ei vaikuta aivan riittävältä kuvaamaan pitkin-tyyppis- 
ten? grammien merkitystä, koska niiden merkityksessä on keskeistä 
myös kiinteä yhteys kiintopisteen muotoon. Rajattuuden kannalta ero 
on kuitenkin selvä: siinä missä poikki-tyyppiset grammit liittyvät aineis- 
tossa aina rajattuihin liiketilanteisiin, pitkin-tyyppiset grammit jättävät 
liikeradan avoimeksi. Rajaamattomaksi pitkin-grammin kuvaa myös 
Huumo (2010, 542). Lehismets (2013, 349) erottaa sen tarkastelemistaan 
läpi-, yli- ja kautta-grammeista voimadynamiikan (Talmy 1985; 2000b) 
perusteella: pitkin-grammilla ei ole hänen mukaansa mahdollista kuvata 
esteen läpäisemistä, mikä luonnollisesti sopii yhteen yleisemmän rajaa- 
mattomuustulkinnan kanssa. 

Rajattuutta käsitellään tässä tutkimuksessa kuitenkin enemmän il- 
maus- tai lausetason piirteenä kuin yksittäisten kielenainesten ominai- 
suutena, ja tämä merkityksen holistisuus huomioiden aineisto on 
luokiteltu arvioimalla jokaista kielennöstä erikseen. Vaikka tietty kielen- 
yksikkö olisikin inherentisti rajaamaton, se voi esiintyä rajatussa kon- 
tekstissa (ks. esimerkiksi Huumo 2010, 543). Suomen aineistossa pitkin- 
ilmaukset esiintyvät rajatuissa konteksteissa (esimerkki 18) jonkin ver- 
ran tyypillisemmin kuin partitiiviobjekti (esimerkki 19). Pitkin-ilmaus 
on osana rajattua kielennöstä 40,4 prosentissa käyttöyhteyksistään ja 
pelkkä partitiiviobjekti 26,6 prosentissa. 


18) Nainen kävelee luolasta metsään polkua pitkin. (trFi#29-025) 
19) Nainen kävelee polkua luolaan. (trFi#33-053) 


37 Larjavaaran (2019, 110, 372) mukaan partitiivin käyttö reitin ilmaisussa näyttää olevan suomessa van- 
hempaa perua kuin pitkin-tyyppiset adpositiorakenteet eikä muodoilla ole suoranaista kehityksellistä 
yhteyttä. 

38 Tarkoitan jatkossa pitkin-tyyppisillä grammeilla ja pitkin-ilmauksilla grammien pitkin, pisin, myöten ja 
myöden käyttöä. Poikki-tyyppisillä grammeilla viittaan grammeihin poikki, halki ja läpi sekä grammin 
yli niiden tapaiseen käyttöön. 
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Kun väylän KESKIVAIHEEN ilmaisua tarkastellaan kokonaisuutena, spa- 
tiaaliset grammit nousevat selvästi tyypillisimmäksi ilmaisukeinoksi (ks. 
kaavio 10). Väyläverbit ohittaa ja ylittää sekä väylän ilmaisun yhdistymi- 
nen totaaliobjektilla ilmaistuun kiintopisteeseen ovat harvemmin käytet- 
tyjä keinoja. Kuten kaaviosta 10 käy ilmi, yleisin KESKIVAIHEEN grammi 
aineistossa on laajakäyttöinen yli (30,2 %). Lähes yhtä paljon käytetään 
grammia ohi (24,5 %). Yksittäisten grammien osuuksiin ei sinällään 
pidä kiinnittää liikaa huomiota, koska niiden määrä on olennaisesti si- 
doksissa stimuluksiin. Kaavion luokkiin on yhdistelty samankaltaisia 
grammeja seuraavasti: edestä = edestä/editse, ohi = ohi/ohitse, poikki = 
poikki/halki, takaa = takaa/taitse, yli = yli/ylitse. Luokassa muu on frek- 
venssiltään edellä mainittuja pienempiä grammeja, ja luokkaan useita 
on luokiteltu kielennökset, joissa väylän KESKIVAIHETTA kielennetään 
ainakin kahdella eri keinolla. 


yli 

ohi 

poikki 

takaa 

ylittää 

edestä 
totaaliobjekti 
muu 

ohittaa 


useita 


0,0% 5,0% 10,0 % 15,0% 20,0% 25,0% 30,0% 35,0% 


Kaavio 10. Väylän KESKIVAIHEEN ilmaisukeinot aineistossa. 
Grammien laaja käyttö näkyy myös väylän KESKIVAIHEEN yhteydessä käy- 


tetyissä verbeissä (ks. taulukko 16): grammit esiintyvät tyypillisimmin 
tapaverbien kanssa (esimerkki 20), ja tämä verbiluokka onkin väylän 
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Taulukko 16. Väylän KESKIVAIHEEN ilmaisussa käytetyt verbit. Selvyyden vuoksi tarkastel- 
tavana ovat kielennökset, joissa on ilmaistu pelkästään väylän KEsKIVAIHE eikä eri vaihei- 
den yhdistelmiä. 


Ilmaustyyppi % Tapa Väylä Suunta: Suunta: Geneerinen Yhteensä 
kävellä — ylittää deiksis muu kulkea n 
mennä nousta 
Väylän KESKIVAIHE 80,6 12,9 1,4 1,7 3,4 589 


KESKIVAIHEEN ilmaisussa selvästi suurin (80,6 %). Vaihtoehtona gram- 
mirakenteille ovat väyläverbit eli lähinnä ylittää ja ohittaa (esimerkki 21). 
Niitä käytetään 12,9 prosentissa kielennöksistä. Geneerisiä liikeverbejä, 
joita edustaa tässä aineistossa ensisijaisesti tavan ja liikkeen suuntaisuu- 
den suhteen neutraali kulkea (esimerkki 22), käytetään 3,4 prosentissa 
kielennöksistä. 


20) Kolme naista kävelee sillan yli. (trFi#28-045) 
21) Poika ylittää pienen kivisillan. (trFi#14-050) 
22) Mies kulkee polun yli. (trFi#48-049) 


Suuntaverbit on tässä katsauksessa jaettu kahtia: deiktisiin ja muihin 
suuntaverbeihin. Deiktiset verbit mennä (n = 131) ja tulla (n = 283) ovat 
väylän KESKIVAIHEESSA vain marginaalisesti edustettuina (1,4 %). Tämä 
on kiinnostavaa suhteessa väylän ALKUUN ja LOPPUUN, joiden ilmaisus- 
sa ne nousevat keskeisiksi erityisesti rajanylitysilmausten yhteydessä 
(Tuuri & Belliard, tulossa). Esimerkin 23 kaltaiset kielennökset, joissa 
deiktinen verbi yhdistyy rajanylitykseen väylän KESKIVAIHEESSA, ovat 
siis aineistossa yksittäistapauksia. Tässä kohdin nousee esiin kysymys 
elisitaatiotilanteen luomasta mahdollisesta rekisterierosta: arkisessa kie- 
lenkäyttötilanteessa mennä X:n yli saattaisi olla käytössä enemmän kuin 
elisitaatioaineistossa. 


23) Naiset menivät sillan yli. (trFi#25-045) 
Muita suuntaverbejä aineistossa ovat vertikaaliset nousta (n = 73) ja las- 
keutua (n = 39) ja niiden lisäksi lähestyä (n = 6). Väylän KESKIVAIHEESSA 
niiden pieni osuus (1,7 %) koostuu esimerkin 24 kaltaisista kielennök- 


sistä, joissa verbi ilmaisee vertikaalisen suunnan. 
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24) Nainen laskeutui portaat. (trFi#16-022) 


Väylän KESKIVAIHEEN ilmaisu on suomessa kielitypologisesti katsoen 
rikasta. Käytetyin ilmaisukeino on spatiaalinen grammi, ja väylä- ja suunta- 
verbit, suuntasija ja objektin sija ovat selvästi harvinaisempia. 


Suunnan kielentämisen keinot 


Suunta on tässä tutkimuksessa merkityskategoria, joka kattaa joukon 
erilaisia rajaamattoman liikkeen spatiaalisten ulottuvuuksien ilmaisu- 
keinoja. Suunnan käsitettä sivuttiin edellisessä jaksossa partitiiviobjek- 
tilla ilmaistun liikeradan sekä pitkin-tyyppisten grammien yhteydessä. 
Vaikka ne eivät aivan ongelmattomasti mielly suunnan ilmaisuksi, ne 
edustavat selvästi rajaamatonta liikerataa suhteessa rajatun liikeradan il- 
maisukeinoihin, kuten totaaliobjektiin ja poikki-tyyppisiin grammeihin. 
Tässä luvussa esittelen muut aineistossa esiintyvät suunnan ilmaisukei- 
not. Väylän ja suunnan rajanveto ei kaikkien kielenyksiköiden kohdalla 
ole yksiselitteistä, vaan merkitykset määrittyvät osin holistisesti konteks- 
tin mukaan. 

Yksi keskeinen aineistossa ilmaistava suunta on kiintopisteestä tai kat- 
sojasta loittoneminen. Sitä ilmaistaan erityisesti grammeilla pois (n = 119) 
ja poispäin (n = 51). Myös kauas-grammin komparatiivi kauemmas (n = 6) 
ilmaisee samantyyppistä merkitystä kuin poispäin. Näistä grammeista ai- 
neistossa tyypillisin pois on kuitenkin yksi väylän ja suunnan rajanvedon 
kannalta haastavista kielenyksiköistä. Osa sen aineistoesiintymistä on 
samantyyppisissä konteksteissa kuin väylän ALKUA ilmaiseva grammi ulos 
(n = 123), osa edustaa selvästi rajaamatonta suuntaa grammin poispäin 
tapaan ja osa jää monitulkintaiseksi näiden välimaastoon. Seuraavaksi 
erittelen tarkemmin näiden kielenyksiköiden käyttöä aineistossa. 

Grammien pois ja ulos käyttöä liittyy usein samoihin videoihin. Esi- 
merkit 25 ja 26 ovat saman videon kielennöksiä, ja havaitaan, ettei 
grammin valinta luo olennaista merkityseroa vaan molemmat grammit 
ilmaisevat yhdessä elatiivisijan kanssa rajanylitystä väylän ALUSSA, siirty- 
mää luola-kiintopisteen ulkopuolelle. 
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25) Nainen kävelee pois luolasta. (trFi#36-023) 
26) Nainen kävelee ulos luolasta. (trFi#39-023) 


Grammien merkityseroa voi hahmotella niiden kanssa esiintyvien kiin- 
topisteiden kautta. Flisitaatiokehyksen liikevideoissa selvärajaisin, säiliö- 
mäisin kiintopiste on useissa videoissa esiintyvä luola. Grammin ulos 
kaikista käyttökonteksteista 75,4 prosenttia on juuri kiintopisteen luola 
yhteydessä, mikä tukee Ojutkankaan (2012, 174) tuloksia, joiden mu- 
kaan Lauseopin arkiston murreaineistossa ulko-kantaisten grammien 
prototyyppinen kiintopiste spatiaalista suhdetta ilmaistaessa on raken- 
nus. Sen sijaan pois-grammi esiintyy kiintopisteen luola kanssa vain 
30,1 prosentissa käytöistään, eli sitä käytetään vaihtelevammin eri kiinto- 
pisteiden kanssa. Lisäksi sillä on myös käyttöä, johon ulos ei sovi. Siihen 
lukeutuvat kiintopisteet, joiden kanssa tarvitaan spatiaalisen relaation 
tarkentava grammi, kuten esimerkin 27 luota. Väylän ALKU on esimer- 
kissä ilmaistu rakenteella puun luota, mutta on tulkinnanvaraista, onko 
pois rakenteessa osana väylän ilmaisua vai edustaako se objektikeskeisen 
viitekehyksen kautta ilmaistua suuntaa — vai kantaako se itse asiassa 
molempia merkityksiä. 


27) Nainen hyppelehtii pois puun luota. (trFi#26-033) 


Kielitoimiston sanakirjassa (2018) grammin sw. ulos spatiaalinen perus- 
merkitys määritellään seuraavasti: ”pois jnk sisästä, jstak t. jnk ulkopuo- 
lelle”, ja grammin sv. pois vastaava määritelmä on laajempi: ”toisaalle, 
muualle, erilleen, eroon, sivuun, irti. 1. ilmauksissa jotka merkitsevät 
toiseen paikkaan t. jnk ulkopuolelle t. jstak etäälle siirtymistä, siirtämistä 
t. joutumista. — — Toisin sanoen ulos ilmaisee välttämättä rajanylityksen 
väylän ALUSSA, kun taas pois on merkitykseltään väljempi ja voi ilmais- 
ta sekä rajanylityksen (esimerkki 25) että etääntymisen kiintopisteestä 
(esimerkki 27). Eroa ilmentävät luonnollisesti myös grammien (subs- 
tantiivi??)täydennysten sijat: ulos on mahdollinen vain elatiivisijaisen 


39 Tässä aineistossa ulos-grammin täydennyksenä toimivat sanat ovat pääosin erilaisia substantiiveja, 
mutta sivuhuomautuksena voidaan todeta, että ulkopaikallissijaisina täydennyksinä voivat esiintyä 
pronominikantaiset adverbit: ulos täältä /sieltä. 
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täydennyksen kanssa, kun taas pois esiintyy elatiivin lisäksi ablatiivin 
kanssa. Suomen pois näyttäytyykin merkitykseltään laajempana kuin 
esimerkiksi germaanisten kielten vastineensa. Frawley (1992, 261, ala- 
viite 4) toteaa, että englannissa in 'sisään' ja out of ”ulos' muodostavat 
keskenään konverssisuhteen, mutta away "pois, kauemmas on vain 
assosiaation (coincidence) negaatio. Vastaavasti esimerkiksi ruotsissa ja 
saksassa on omat kielenyksikkönsä, jotka ilmaisevat samoja merkityksiä 
kuin away ja out of, mutta suomeen Frawleyn analyysi ei päde, koska 
pois voi ilmaista kumpaakin merkitystä. 

Grammin pois merkityksen moninaisuus hahmottuu paremmin, kun 
mukaan vertailuun otetaan grammi poispäin. Se ei esiinny aineistossa 
pois- ja ulos-grammien kaltaisesti elatiivisijan ja säiliömäisen kiintopis- 
teen kanssa. Esimerkissä 25 ilmauksella pois luolasta kielennetään ensi- 
sijaisesti naisen siirtymä luolan ulkopuolelle. Ainoa tulkintavaihtoehto 
on, että nainen on ensin ollut luolassa mutta siirtyy nyt sen ulkopuolelle. 
Siirtymän jälkeen nainen ei välttämättä etäänny kauas luolasta vaan saat- 
taa jäädä myös sen välittömään läheisyyteen. Kun tilannetta verrataan 
sinällään mahdolliseen keksittyyn esimerkkiin 28, käy selväksi, että 
grammin poispäin käyttö samassa kontekstissa edellyttäisi naisen selvää 
etääntymistä luolan sijainnista. Sen sijaan esimerkki jättää avoimeksi, 
onko nainen lainkaan ollut sisällä luolassa. Grammin poispäin osana on 
partikkeli päin, jonka merkitys sellaisenaan on kohti tai ’vastaan’ ja joka 
olo- tai suuntasijaisen spatiaalisen ilmauksen yhteydessä ilmaisee suun- 
taisuutta tai summittaisuutta (Hakulinen, Vilkuna, Korhonen, Koivisto, 
Heinonen & Alho 2004, 697). Voidaan myös sanoa, että päin-partikkeli 
on nimenomaan rajaamaton, suunnan vektoria ilmaiseva elementti (ks. 
myös Nikanne 1990, 44). 


28) Nainen kävelee poispäin luolasta. 
Edeltävistä esimerkeistä käy ilmi, miten spatiaalinen informaatio raken- 


tuu eri osien kautta: siihen vaikuttaa paitsi grammi ja sija myös maail- 
mantieto kiintopistettä edustavan entiteetin ominaisuuksista. Spatiaali- 


40 Vastaavasti muodostettu grammi ulospäin esiintyy aineistossa 2 kertaa, ja sisäänpäin ei lainkaan. 
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sen merkityksen distribuutiota (ks. Sinha & Kuteva 1995) voidaan ha- 
vainnollistaa vielä toisen poispäin-grammia koskevan esimerkin kautta: 
Esimerkissä 29 kiintopisteenä on puu, joka ei hahmotu luolan tapaan 
säiliöksi. On siis selvää, ettei lauseen merkitykseen sisälly siirtymää pois 
puun sisältä tai edes sen oksilta vaan pelkästään etääntyminen puun 
läheisyydestä. Esimerkin 29 tulkinta kääntyy jo rajaamattomuuden puo- 
lelle, koska aivan tarkka lähtöpiste jää avoimeksi ja sijoittuu vain jonne- 
kin suhteellisen lähelle puuta. Se vertautuu esimerkin 30 ilmaukseen 
kauemmas puusta, jossa lähtötilanne jää samaan tapaan epätarkaksi. 


29) Nainen kävelee puusta poispäin. (trFi#10-032) 
30) Nainen käveli kauemmas puusta. (trFi#5-052) 


Jos pois-grammin käyttöä jäsennetään väylän ja suunnan väliseksi jatku- 
moksi, pois näyttää siis ilmaisevan selvimmin väylää sentyyppisissä 
konteksteissa, joissa voidaan käyttää myös ulos-grammia. Toisessa ääri- 
päässä pois ilmaisee suuntaa samankaltaisesti kuin poispäin. Esimerkit 
31-33 ovat saman videon kielennöksiä, joissa pois ja poispäin ovat jok- 
seenkin samanlaisessa käytössä. Videolla nainen kävelee puistoaukiolla 
metsänreunaa kohti. Video on kuvattu melko kaukaa takaapäin. Naisen 
saapumista metsään ei näytetä, eikä liikkeelle näy myöskään selvää alku- 
pistettä, vaan videon alkaessa nainen on jo liikkeellä. Esimerkeissä pois 
ja poispäin edustavat siis näkökulmakeskeistä suunnan ilmaisua: niillä 
ilmaistaan naisen etääntyvän katsojasta itsestään (esimerkki 31 ja 32) 
tai eksplisiittisesti mainitusta kamerasta (esimerkki 33), jonka sijainti 
luonnollisesti vastaa katsojan näkökulmaa. Tällaisissa konteksteissa pois 
on harvinainen mutta poispäin hyvin tavallinen. 


31) Nainen kävelee pois. (trFi#6-052) 

32) Nainen käveli poispäin puistikossa. (trFiffr7-052) 

33) Nainen kävelee nurmikkoa pitkin poispäin kamerasta. (trFi#8-052) 
Yksittäisissä kielennöksissä pois ja poispäin esiintyvät myös yhdessä. Kie- 


lennöksessä 34 siirtymän luolasta ilmaisee lauseke pois sieltä luolasta, 
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ja poispäin tarkentaa oletettavasti suuntaa näkökulmakeskeisesti, koska 
nainen liikkuu videolla kauemmas katsojasta. 


34) Siinä oli luola ja sit nainen kävelee pois sieltä luolasta poispäin. 
(trFi#31-025) 

35) Siinä oli- nainen makas nurmikolla ja mies käveli pois sen luota pois- 
päin. (trFi#22-035) 


Esimerkissä 35 aineistonkeruutilanne näkyy ehkä hiukan epäluontevana 
tarkkuutena, mutta kiinnostavaa on liikkeen suunnan tähdentäminen 
poispäin-grammilla. Lauseke pois sen luota näyttäisi siis ilmaisevan väy- 
län ALUN, siirtymän erilleen kiintopisteestä nainen ja poispäin ilmaise- 
van suuntaa. Videolla mies kulkee suoraan katsojaa kohti, joten poispäin 
ei ilmaise miehen liikettä suhteessa katsojan sijaintiin vaan edelleen 
objektikeskeisesti suhteessa maassa makaavaan naiseen. 

Ilmauksille pois ja poispäin vastakkaista suuntaa edustavat erilaiset ta- 
vat kielentää lähestymistä, ”kohti'-merkitystä. Aineistossa tämänkaltaista 
merkitystä ilmaistaan runsaasti grammilla kohti (n = 191), yksittäisissä 
tapauksissa myös grammeilla kohden (n = 1) ja päin (n = 3).f Papahagin 
(2011, 125) mukaan on typologisesti tavallista, ettei ”kohti'-merkitystä 
ilmaisevaan adnominaaliin sisälly kiintopisteen muotoon liittyvää tietoa 
eli tässä käytetyin termein alan kielentämistä, joka suomessa tyypillisesti 
kytkeytyy väylän ilmaisuun. Kohti-ilmauksiin ei liity samaa tilannekoh- 
taista vaihtelua väylän ja suunnan välillä kuin pois-ilmauksiin, vaan ne 
edustavat yksiselitteisesti suuntaa. 

Valtaosa kohti-tyyppisistä ilmauksista edustaa objektikeskeistä vii- 
tekehystä, eli niissä on ilmaistu kiintopisteobjekti, johon eteneminen 
suhteutetaan (esimerkki 36). 


36) Nainen kulkee kohti puuta. (trFi#48-061) 


41 Grammilla päin voi ilmaista myös KONTAKTIA (esimerkiksi Nainen kävelee melkein puuta päin puistossa 
[trFi#40-061]), mutta tätä merkitystä edustavia tapauksia ei ole tässä laskettu mukaan suunnan ilmai- 
suun. 
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Viitekehys voi kuitenkin olla myös näkökulmakeskeinen, kuten esimer- 
kissä 37, jossa kielentäjä suhteuttaa liikkeen omaan näkökulmaansa 
kohti-grammilla. Lisäksi ”kohti?-merkityksistä suunnan ilmaisua sisältyy 
esimerkissä 37 tulla-verbiin. Se liittyy aineistossa kuitenkin ensisijaisesti 
väylän ALUN ilmaisuun (esimerkki Nainen tulee luolasta) ja jää siksi tässä 
yhteydessä suuresta frekvenssistään huolimatta vähälle huomiolle (ks. 
tarkemmin Tuuri & Belliard, tulossa). Esimerkissä 38 käytetty verbi 
lähestyä (n = 6) ilmaisee selvemmin rajaamatonta kohti-tyyppistä mer- 
kitystä mutta on puolestaan aineistossa harvinainen. Niin ikään pieni- 
frekvenssinen lähelle-grammin komparatiivi lähemmäs (n = 5) edustaa 
aineistossa käytöltään kohti-tyyppistä merkitystä ja on käytössä nimen- 
omaan näkökulmakeskeisesti, katsoja itse kiintopisteenään (ks. esimerk- 


ki 39). 


37) Nainen tulee kohti luolasta. (trFi#50-023) 
38) Mies lähestyy nurmikolla makaavaa naista. (trFi#19-036) 
39) Poika kävelee lähemmäs. (trFi#14-067) 


Vertikaalisen suunnan ilmaisua sisältyy grammeihin ylös (n = 116) ja 
ylöspäin (n = 34) sekä alas (n = 82) ja alaspäin (n = 12) sekä verbeihin 
nousta (n = 73) ja laskeutua (n = 39). Suuntaisuutta myös yhdistyy tavan 
ilmaisuun verbeissä kiivetä (n = 23) ja kivuta (n = 3). Vertikaalista liike- 
rataa ilmaisevissa grammeissa suunta on aina keskeisenä merkityksenä, 
mutta niiden käytössä voi myös hahmottaa väylän ja suunnan jatku- 
moa samankaltaisesti kuin edellä on esitetty pois- ja poispäin-grammien 
käytön jäsentyvän. Esimerkiksi grammin ylös merkityksen nyansseja 
havainnollistaa hyvin video 029, jossa nainen nousee sammaloituneita 
kiviportaita. Liikkeen lähtöpisteenä näkyy videolla luolaksi tulkittava tila, 
josta käsin video on kuvattu. Nainen siis etääntyy katsojasta. Esimerkki 
40 havainnollistaa paitsi väylän ja suunnan rajanvedon häilyvyyttä ver- 


42 Vastaavasti mennä-verbin voi katsoa kantavan merkitystä 'pois/poispäin', mutta se liittyy aineistossa 
ensisijaisesti väylän LOPUN ilmaisuun ja jää siis tässä tarkastelussa sivuun (ks. kuitenkin Tuuri & 
Belliard, tulossa). 

43 Tässä aineistossa verbit kiivetä ja kivuta edustavat ylöspäin suuntautuvaa liikettä, mutta marginaali- 
sesti niillä on myös mahdollista ilmaista alaspäin suuntautuvaa liikettä, kuten Kielitoimiston sanakirjan 
(2018) esimerkkilauseessa Kiipeä heti alas pöydältä! 
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tikaalisten grammien kohdalla, myös jälleen spatiaalisen merkityksen 
distribuutiota (Sinha & Kuteva 1995): Elatiivi ilmaisee väylän ALKUA, 
mutta sen rinnalla onkin tyypillisempien väylän ALUN grammien (pois 
tai ulos) sijaan vertikaalinen ylös, joka hahmottuu tässä sekä suunnan il- 
maisimeksi että osaksi väylän ilmaisua. Kiintopisteestä kielentäjä käyttää 
lekseemiä onkalo, joka tarkoittaa syvännettä ja sisältää siten kiintopis- 
teen muodon kautta rakentuvaa tietoa poistumisen vertikaalisesta suun- 
nasta. Ilmaus onkalosta ylös näyttää siis ilmaisevan toisteisesti sekä väy- 
län ALKUA että suuntaa. 


40) Ja siinä nainen käveli tommosia portaita pitkin jostain pimeästä 
onkalosta ylös. (trFi#22-029) 


Toisessa saman videon kielennöksessä (esimerkki 41) väylän ALKU on 
sen sijaan ilmaistu omassa luolasta ulos -lausekkeessaan, ja ylös-grammi 
onkin selvemmin osana suunnan ilmaisua. 


41) Nainen kävelee luolasta ulos kivirappusia pitkin ylös. (trFit20-029) 
Grammit ylös ja alas ovat mahdollisia sekä väylän että suunnan ilmaisus- 
sa, kun taas päin-partikkelilla muodostetut ylöspäin ja alaspäin liittyvät 
odotuksenmukaisesti aina suunnan ilmaisuun (esimerkki 42). 

42) Poika kävelee hiekkaista polkua alaspäin. (trFi#35-067) 
Vertikaalisten ilmausten rajatuinta ääripäätä edustavat esimerkin 43 
kaltaiset ilmaukset: kiveltä maahan hyppääminen on luonteeltaan niin 
selvärajainen ja punktuaalinen tapahtuma, että grammin alaspäin rajaa- 
mattomuus olisi ristiriidassa tapahtuman rajattuuden kanssa. 

43) Poika hyppää alas kiveltä. (trFitt206-034) 

Jonkin verran aineistossa käytetään myös lateraalisen akselin suunnan 
ilmauksia oikea (n = 50) ja vasen (n = 57). Näitä näkökulmakeskeisiä 


ilmauksia käytetään sekä kielennöksen ainoana spatiaalisena informaa- 
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tiona että muun väylän tai suunnan ilmaisun ohella, kuten käy ilmi esi- 
merkeistä 44 ja 45, jotka ovat saman videon granulariteetiltaan erilaisia 
kielennöksiä. 


44) Nainen käveli vasemmalta oikealle. (trFi#43-048) 
45) Nainen tuli metsästä vasemmalta ja meni polun poikki oikealle. 
(trFi#25-048) 


Harvakseltaan käytettyä suunnan ilmaisua edustaa eteenpäin (n = 7). Se 
suhteuttaa muuttujan liikkeen muuttujan aiempaan sijaintiin eikä ole 
riippuvainen havainnoijan näkökulmasta (ks. myös Blomberg 2014, 64). 
Tämä havainnollistuu ilmauksen käyttöä tarkastelemalla, vaikka otos 
toki jääkin pieneksi: ilmausta käytetään kaikista kuvakulmista kuvat- 
tujen videoiden kielennöksissä. Esimerkissä 46 kielennetyssä videossa 
nainen kävelee puun luota suoraan kameraa kohti, eli kielentäjä kuvaa 
frontaalista akselia muuttujan, ei itsensä näkökulmasta. 


46) Nainen kävelee puun edestä eteenpäin. (trFitt7-032) 


Kouluikäisten ja nuorten aikuisten kirjoitelmissa suuntaa ilmaisevat 
grammit ovat yleisemmin käytössä kuin väylän KESKIVAIHETTA ilmaise- 
vat grammit. Nuorimmat käyttävät runsaasti grammeja ulos ja pois, mut- 
ta myös kohti esiintyy muutaman kerran, satunnaisemmin käytössä on 
muita. Grammit ulos ja pois voivat olla nuorimmilla myös toistensa vaih- 
toehtoja mutta eivät niinkään enää vanhimmilla, joilla esimerkiksi (läh- 
teä) pois korvautuu usein verbillä poistua. Ehkä huomiota herättävintä 
on kohti-grammin runsastuminen yläkoululaisista nuoriin aikuisiin. 
Sen tyypillinen käyttökonteksti on kerronnan vaihdokset tai siirtymät, 
joissa otetaan suunta kohti jotain uutta paikkaa, lähdetään kohti jotakin. 
Leksikaalinen diversiteetti nousee iän myötä samoin kuin väylän KESKI- 
VAIHEEN kielennöksissä. 

Verbeistä tapaverbit hallitsevat sekä suunnan ilmaisua (esimerkki 47) 
että myös tässä tutkimuksessa rajaamattomaan liikerataan rinnastettuja 
PAIKKA-ilmauksia (esimerkki 48) (ks. taulukko 17). Suunnan ilmauksis- 
ta tapaverbejä käytetään 78,8 prosentissa ja PAIKKA-ilmauksista 96,2 
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Taulukko 17. Suunta- ja PAIKKA-ilmauksissa käytetyt verbit. 


Ilmaustyyppi Tapa Suunta: muu Geneerinen Suunta: Muu Yhteensä 
% kävellä nousta kulkea deiksis mennä n 
Suunta 78,8 13,6 55 0,5 11 419 
PAIKKA 96,2 - 3,4 0,5 - 208 


prosentissa. Muista verbeistä keskeisiksi nousevat vain muuta kuin 
deiktistä suuntaa ilmaisevat suuntaverbit. Niiden 13,6 prosentin osuus 
suunnan ilmauksissa koostuu lähinnä vertikaalisten nousta- ja laskeu- 
tua-verbien käytöstä (esimerkki 49). 


47) Ihmiset kävelevät kohti rantaa. (trFi#2-066) 
48) Poika juoksee rantahietikolla. (trFi#11-042) 
49) Nainen nousee metsäpolkua. (trFi#14-070) 


Geneeristen verbien osuus on suunnan ilmauksissa hiukan suurempi 
kuin PAIKAN ja väylän KESKIVAIHEEN ilmauksissa (ks. taulukko 16). 
Osuus koostuu kokonaan kulkea-verbin käytöstä (esimerkki 50). 


50) Nainen kulkee polkua pitkin ylöspäin. [trFi#32-070] 


Väylän KESKIVAIHEEN ja suunnan variaatio kulkureitin 
ilmaisussa 


Erilaiset kulkureitit ovat liiketilanteissa luontevia kiintopisteitä ja myös 
Trajectoire-elisitaatiokehyksessä keskeisiä: niitä edustavat videoissa paitsi 
erilaiset tiet ja polut myös sillat sekä portaat. Tässä luvussa tarkastelen 
rinnakkain väylän KESKIVAIHEEN ja suunnan sekä niiden ohessa myös 
PAIKAN ilmaisua, koska nämä näyttäytyvät erityisesti kulkureittejä kuvaa- 
vien videoiden kohdalla vaihtoehtoisina käsitteistämisen tapoina: koe- 
henkilöt tulkitsevat samaa videota esimerkiksi sillan ylitykseksi (väylän 
KESKIVAIHE), siltaa pitkin kulkemiseksi (suunta) ja sillalla kulkemiseksi 
(PAIKKA). Väylän KESKIVAIHEEN ilmaisu esittää tilanteen spatiaalisesti 
rajattuna, suunnan ja PAIKAN ilmaisu rajaamattomana. 
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Tarkastelun taustaksi on hyvä huomioida, että kun otetaan huomioon 
koko liikeilmausten aineisto, siis myös väylän ALUN ja LOPUN ilmaukset, 
yksimielisimmin rajattuina kielennetyt videot ovat sellaisia, joissa näkyy 
selkeä rajanylitys (ks. myös Tuuri & Belliard, tulossa). Kaikkien tai lähes 
kaikkien koehenkilöiden rajattuina kielentämiin videoihin kuuluu paitsi 
siirtymiä pois rajatusta tilasta (esimerkiksi Nainen kävelee pois metsästä) 
tai rajattuun tilaan (esimerkiksi Poika kävelee luolaan) myös väylän 
KESKIVAIHEEN rajanylityksiä, joissa ylitetään este (esimerkiksi Mies hyp- 
pää tukin yli). Rajanylitys näyttää pääsääntöisesti tulevan kielennetyksi, 
jos sellainen videossa on. Kulkureittiä kuvaavien videoiden tapauksessa 
rajanylityksen ilmaisu ei kuitenkaan näyttäydy aivan yhtä selkeänä ten- 
denssinä, kuten tämän luvun analyysissä käy ilmi. 

Kulkureittien lisäksi aineistossa esiintyviä väylän KESKIVAIHEESEEN 
ja suuntaan liittyviä kiintopisteitä ovat erilaiset objektit ja henkilöt sekä 
laajemmat alueet, kuten puistot ja metsät. Näitä muita tyyppejä otan 
tarpeen mukaan vertailukohdiksi. Keskityn analyysissä kahteen granu- 
lariteetin tasoon van Stadenin ja Narasimhanin (2012) esitystä soveltaen: 
siihen, mitä liiketilanteen elementtejä ilmaistaan, ja siihen, millaisia 
kielellisiä keinoja ilmaisussa käytetään. Yleisluontoisemman analyysin 
lomassa tarkastelen keskeisiin ilmaisukeinoihin liittyviä merkityspiirtei- 
tä yksityiskohtaisemmin. Seuraavassa tarkastelen ensin ilmauksia, joissa 
kiintopisteenä on tie tai polku, sitten ilmauksia, joissa kiintopisteenä on 
silta, ja lopuksi ilmauksia, joissa kiintopisteenä on portaat. 


KIINTOPISTEENÄ TIE TAI POLKU 

Videoista, joiden kiintopisteenä on tie tai polku (ks. taulukko 18), kaksi 
on ilmaistu pääosin rajattuna väylänä, mutta ei kuitenkaan aivan yksi- 
mielisesti. Videoissa 049 (40/50 rajattu) ja 048 (39/50 rajattu) katsojan 
eteen aukeaa polku metsäisessä maisemassa. Videossa 049 polun yli 
kulkee mies oikealta vasemmalle ja videossa 048 nainen vasemmalta 
oikealle. Muuttuja ilmestyy tielle oksien katveesta ja polun ylityksen jäl- 
keen katoaa jälleen polun toisella puolen olevaan metsikköön. Valtaosa 
koehenkilöistä kuitenkin keskittyy kielennöksissään väylän KESKIVAI- 
HEESEEN eli kielentää vain polun ylityksen. Liiketilanteet kuvataan pää- 
osin rajanylityksenä joko grammilla tai ylittää-verbillä. Grammeista käy- 
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tetyin on yli, mutta kielennöksissä esiintyy monipuolisesti myös muita 
grammeja: poikki, läpi ja jopa rajaamaton pitkin (esimerkki 51), vaikka 
liike ei etene polun suuntaisesti, mikä jälleen viittaa grammien mer- 
kityksen joustavuuteen ja mahdollisesti subjektiivisiin eroihin niiden 
hahmotuksessa. Rajaamattomana kyseiset videot on kielennetty tyypilli- 
simmin suhteellisen epätarkasti PAIKKA-ilmauksella (esimerkki 52). Luo- 
kassa n/a ovat kielennökset, jotka eivät sisällä minkäänlaista spatiaalista 
informaatiota (esimerkiksi Mies lenkkeilee). 


Taulukko 18. Väylän KESKIVAIHETTA kuvaavat videot, joissa kiintopisteenä on tie tai polku. 


Video Kuvakulma Väylä Suunta PAIKKA n/a 
049: Mies kävelee polun yli sivusta 40/50 2/50 8/50 - 
048: Nainen kävelee polun yli sivusta 39/50 4/50 7/50 = 
037: Mies juoksee polkua ylös sivusta/edestä — 9/50 34/50 5/50 2/50 
041: Ryhmä kävelee metsätietä sivusta/edestä 4/50 28/50 18/50 -= 
067: Poika kävelee kivikkoista polkua edestä 3/50 — 35/50 — 11/50 1/50 
065: Poika kävelee vuoristopolkua sivusta - 34/50 14/50 2/50 


51) Mies kulkee polkua pitkin metsään. (trFi#32-049) 
52) Nainen kävelee puistossa. (trFi#4-048) 


Muut videot, joissa muuttuja liikkuu suhteessa polkuun tai tiehen, edusta- 
vat pääosin rajaamatonta liikerataa. Video 065 on useimmin rajaamatto- 
mana kielennetty video: suunta- ja PAIKKA-ilmauksia siitä käyttää 48 koe- 
henkilöä. Se on myös ainoa video, jonka liikerataa kukaan koehenkilöis- 
tä ei ole kielentänyt rajatuksi. Videolla poika kävelee korkealla vuoren- 
rinteellä hyvin kapeaa polkua vasemmalta oikealle. Video on kuvattu 
sivusta ja melko kaukaa, joten pojan etenemistä näkyy suhteellisen pit- 
kä matka. Poika on liikkeellä videon alkaessa ja jatkaa liikettään videon 


44 Videoiden kielelliset kuvaukset edustavat tässä ja muissa taulukoissa luonnollisesti vain yhtä tapaa 
kielentää tilanne. Selkeyden vuoksi kuvauksissa on käytetty koko aineistossa yleisimpiä tapaverbejä, 
vaikka joidenkin videoiden tapauksessa muuntyyppinen verbi voi olla tavallisempi. 

45 Tässä tarkasteltujen videoiden kielennöksistä 16:ssa rajattuustulkinta syntyy muuten kuin väylän KESKI- 
VAIHEEN ilmaisun kautta. Esimerkiksi videon 048 kielennöksessä Nainen tulee jostaki siimeksestä ja jat- 
kaa kävelyä [trFi#44-048] koehenkilö keskittyy tyypillisemmin huomioidun polun ylityksen sijaan väylän 
ALKUUN, jossa nainen poistuu metsiköstä. Nämä tapaukset muodostavat kuitenkin vain 0,5 prosenttia 
tässä tarkasteltujen videoiden rajatuista kielennöksistä. 
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päättyessä, minkä vuoksi onkin odotuksenmukaista, ettei tilannetta tul- 
kita spatiaalisesti rajatuksi. 

Videon 065 kuvauksissa on eniten pitkin-tyyppisiä grammeja (eli pit- 
kin- ja myöten-grammeja variantteineen): niitä käyttää 21 koehenkilöä. 
Grammin pitkin merkitys kuvataan Kielitoimiston sanakirjassa (2018) 
paitsi myöten-synonyymilla myös ’seuraamisen’ tai noudattamisen il- 
maisuksi. Kapean polun seurailu vuorenrinteen mukaisesti näyttäytyy- 
kin otollisena kontekstina pitkin-grammille. Lähes yhtä moni, 20 koe- 
henkilöä, käyttää pitkin-tyyppisiä grammeja videosta 041, jossa muuta- 
man henkilön joukko kulkee metsän siimeksessä mutkittelevaa polkua. 
Tässäkin videossa kiintopiste on suhteellisen pitkä ja kapea polunpätkä, 
jonka muotoa muuttujat seurailevat. 

Ylipäätään pitkin-tyyppisten grammien käyttö liittyy aineistossa sel- 
keästi lineaarista kulkureittiä edustaviin kiintopisteisiin, ja sama pätee 
myös pelkällä partitiiviobjektilla kielentämiseen (ks. esimerkki 53). 


53) Mies juoksee polkua. (trFi#9-037) 


Laajempien alueiden yhteydessä kummankintyyppiset ilmaukset ovat 
epätyypillisiä. Poikkeuksen muodostaa video 076, jonka liikerataa 19 koe- 
henkilöä ilmaisee partitiiviobjektilla ja kolme pitkin-rakenteella. Videolla 
pikkupoika kävelee rantakalliolla kohti kameraa, ja kallio viettää selvästi 
alaspäin. Partitiiviobjekti esiintyykin videon kielennöksissä nimen- 
omaan vertikaalista suuntaa ilmaisevien elementtien kanssa (esimerkki 
54 ja 55), jotka yhdessä kiintopisteen kanssa ilmaisevat muuttujan liike- 
radan. 


54) Poika kävelee kalliota alas. (trFi#4-076) 
55) Pikkupoika laskeutui varovasti kalliorinnettä. (trFi#18-076) 


Pelkkä partitiiviobjekti ei tyypillisesti näytäkään riittävän ainoaksi spa- 
tiaaliseksi informaatioksi laajempaa aluetta kuvaavien kiintopisteiden 
kanssa (ks. keksitty esimerkki 56). Lineaariseen kiintopisteeseen parti- 
tiiviobjekti yhdistyy luontevasti sellaisenaankin (ks. esimerkki 53). 
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56) Mies juoksee ?puistoa/aukiota/rantahiekkaa. 


Epätyypillisiä ovat myös pitkin-ilmaukset aluemaisten kiintopisteiden 
yhteydessä. Niitä esiintyy ainoastaan kolme nurmikko-kiintopisteen (esi- 
merkki 57), kolme kallio-kiintopisteen ja kaksi (ranta)hiekka-kiintopis- 
teen yhteydessä. 


57) Nainen kävelee nurmikkoa pitkin poispäin kamerasta. (trFi#8-052) 


Laajaa aluetta kuvaavien kiintopisteiden kanssa tavanomaisempaa ilmai- 
sua voisikin olla pitkin-adposition prepositiokäyttö, joka Huumon (2010, 
536) mukaan kantaa hajanaisuuden ja epämääräisyyden merkityksiä, 
kun taas postpositiokäyttö liittyy enemmän varsinaiseen väylän tai suun- 
nan ilmaisuun. Elisitoidun aineiston liikeradat ovat kuitenkin pääosin 
melko suoraviivaisia, joten pitkin-grammin prepositiokäyttöä (esimerkki 
58) on koko aineistossa vain kuusi esiintymää. 


58) Poika juoksee pitkin rantahiekkaa. (trFitt20-042) 


PAIKKA-ilmausten osuus on koko aineistossa 7,6 prosenttia. Kolmea 
kaikista elisitaatiokehyksen videoista eniten PAIKKA-ilmauksia tuotta- 
nutta videota yhdistää se, että kiintopiste on laaja alue, ei tarkkarajainen 
kulkureitti. parkka-ilmauksia käyttää enemmistö, 37 koehenkilöä, vain 
videosta 042, jossa sivusta kuvattu poika juoksee hiekkarannalla vasem- 
malta oikealle korkean ruovikon reunaa (esimerkki 59). Videosta 051, 
jossa nainen kävelee puistossa, niitä käyttää 25 koehenkilöä. Video 076, 
jossa poika kävelee rantakallioilla, on kielennetty PAIKKA-ilmauksella 21 
kielennöksessä. 


59) Poika juoksee rantahietikolla. (trFi#45-042) 
Niistä videoista, joissa kiintopisteenä on kulkureitti, PAIKKA-ilmauksia 
käyttää 0-18 koehenkilöä. Osa tapauksista perustuu kuitenkin siihen, 
että kiintopisteeksi on itse asiassa kielennetty liiketilanteen laajempi 


ympäristö, esimerkiksi polun sijaan metsä. Videota 041 on kuvattu kul- 
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kureittivideoista eniten PAIKKA-ilmauksilla, mutta lähempi tarkastelu 
osoittaa, että 18 PAIKKA-ilmauksesta seitsemässä kiintopisteenä on alue 
(esimerkki 60) kulkureitin (esimerkki 61) sijaan. 


60) Joukko ihmisiä kulkee metsässä. (trFitt30-041) 
61) Ryhmä ihmisiä kävelee metsäpolulla. (trFi#34-041) 


KIINTOPISTEENÄ SILTA 

Niihin videoihin, joissa kiintopisteenä on silta, lukeutuvat eniten rajattu- 
na kielennetyt kulkureittivideot (ks. taulukko 19). Videossa 046 (49/50 
rajattua) mies ylittää siltaa, jolla seisoskelee muutaman naisen joukko 
keskustelemassa. Videossa 045 (46/50 rajattua) naisjoukko ylittää siltaa. 
Pääosin rajattuna on kuvattu myös video 047 (42/50 rajattua), jossa nai- 
nen ylittää siltaa, jolla mies seisoo katselemassa veteen. Näitä enemmän 
suunnan ja PAIKAN ilmaisua liittyy videoon 050 (22/50 rajattua), jossa 
poika kävelee siltaa pitkin. 


Taulukko 19. Videot, joiden kiintopisteenä on silta. 


Video Kuva- Väylä Suunta PAIKKA n/a 
kulma 

046: Mies kävelee sillan yli naisten ohi takaa 49/50 - 1/50 =- 

045: Naiset kävelevät sillan yli takaa 46/50 2/50 2/50 — 

047: Nainen kävelee sillan yli miehen ohi sivusta 42/50 2/50 1/50 5/50 

oso: Poika kävelee siltaa pitkin/sillan yli sivusta/ 22/50 14/50 14/50 =- 
takaa 


Videoissa 046 ja 047 väylän KESKIVAIHETTA ilmaistaan suhteessa kah- 
teen eri kiintopisteeseen: molemmissa muuttuja ylittää sillan ja lisäksi 
kulkee elollisen kiintopisteen ohi. Itse asiassa videoita 046 ja 047 on 
tyypillisemmin kielennetty rajattuna juuri ohituksen, ei niinkään ylityk- 
sen kannalta: videosta 046 koehenkilöistä 35 kielentää pelkän ohituksen, 
videosta 047 puolestaan 39 koehenkilöä. Silta on tyypillinen kiintopiste 
siinä mielessä, että se on muuttujaa pysyvämpi ja suurempi taustaele- 
mentti, mutta on myös odotuksenmukaista, että koehenkilöiden huomio 
kiinnittyy videolla näkyviin ihmisiin, jotka tulevat myös kielennösten 
kiintopisteiksi. Kahden erillisen väylän KESKIVAIHEEN rajanylityksen 
yhdistäminen samaan kielennökseen on näissä tapauksissa jokseenkin 
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harvinaista (n = 9), vaikka monet koehenkilöt tuottavat ylipäätään pitkiä 
ja kompleksisia kuvauksia. Tällaisista kielennöksistä useimmissa (n = 7) 
rajanylitykset on ilmaistu erillisissä lauseissa (esimerkki 62). Vain kaksi 
kielennöstä sisältää kaksi eri kiintopisteisiin liittyvää väylän ilmausta, 
joista toisessa on väyläverbi ja toisessa väylägrammi (esimerkki 63). 


62) Mies ylittää sillan ja ohittaa keskustelevat naiset. (trFi#33-046) 
63) Nainen ylittää sillan miehen ohi. (trFi#15-047) 


Video 050 on siltavideoista ainoa, jossa rajaamattoman liikeradan ilmai- 
su (suunta ja PAIKKA-ilmaukset) on rajattua yleisempää. Video onkin ra- 
jattuuden suhteen erityisen monitulkintainen: siinä poika kävelee ranta- 
maisemassa kivisellä polkumuodostelmalla, joka koostuu kahdesta 
peräkkäisestä pienestä sillasta. Videolla näkyy vain yhden sillan ylitys, 
mutta toinenkin silta näkyy videolla pojan etenemissuunnassa. Video 
havainnollistaa hyvin eroja yksittäisten koehenkilöiden kielentämisstra- 
tegioissa. Esimerkissä 64 koehenkilö poimii videosta pelkän ylityksen, 
kun taas esimerkissä 65 ylityksen lisäksi huomioidaan liikkeen jatkumi- 
nen ja pyritään näin kattamaan koko tilanne. 


64) Poika ylittää sillan. (trFi#15-050) 
65) Poika kävelee kivisillan yli ja jatkaa muuria myöten. (trFi#10-050) 


Esimerkissä 66 koehenkilö kuvaa liikeradan rajaamattomaksi pitkin- 
tyyppisellä grammilla ja tarkentaa polun sijaintia PAIKKA-ilmauksella 
kivimuodostelmien päällä. Lisäksi hän täydentää videolla nähdyn suh- 
teellisen monimutkaisen liiketilanteen kuvausta toteamuksella alhaalla 
virtaa vesi. Esimerkissä 67 koehenkilö käyttää pelkästään PAIKKA-ilmauk- 
sia, jotka kuitenkin kuvaavat tilanteen melko yksityiskohtaisesti, kaikki 
keskeiset elementit huomioiden. 


66) Poika kävelee semmosta polkua pisin joka on kivimuodostelmien 
päällä ja alhaalla virtaa vesi. (trFi#24-050) 

67) Poika kävelee veden ääressä tällaisen pienen kivistä rakennetun 
sillan päällä tai polun- kivipolun päällä. (trFi#1-050) 
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Erityisesti videon 050 yhteydessä nähtävä vaihtelu sillan yli- ja siltaa pit- 
kin -ilmauksissa nostaa esiin myös eroja yli-grammin käsitteistykses- 
sä eri kiintopisteiden kanssa, mikä on jälleen esimerkki semanttisesta 
distribuutiosta. Lekseemin silta merkitys määrittää yli-grammin merki- 
tyksen erilaiseksi kuin muiden aineistossa esiintyvien lineaarista kulku- 
reittiä kuvaavien lekseemien kanssa. Esimerkiksi ilmauksessa tien yli 
grammin yli merkitys hahmotetaan poikki-grammia vastaavaksi: muut- 
tuja kulkee tien kulkusuunnan vastaisesti, tien reunasta toiseen. Silta- 
kiintopiste kuitenkin muodostaa poikkeuksen, koska ilmauksella sillan 
yli kielennetään sillan kulkusuunnan mukainen sillan alusta loppuun 
kulkeminen. Ilmauksilla sillan yli ja siltaa pitkin ilmaistaan siis nimen- 
omaan ero liiketilanteiden rajattuudessa. 

Sama kiintopisteen vaikutus spatiaalisen lekseemin merkitykseen 
on luonnollisesti nähtävillä myös ylittää-verbin käytössä. Ilmaus ylittää 
silta käsitetään suhteessa kiintopisteeseen toisensuuntaiseksi liikkumi- 
seksi kuin ylittää tie. Verbi ylittää esiintyy aineistossa valtaosin juuri 
näiden kahden kiintopisteen kanssa. Niiden lisäksi yhdessä kielennök- 
sessä miehen loikka maassa olevan paksun tukin yli kielennetään puun 
ylittämiseksi. Selvästi eniten verbiä ylittää käytetään videosta 045, jossa 
naisjoukko kävelee sillan yli ja heidän etenemistään kuvataan takaapäin 
niin, että silta näkyy suoraan niin naisten kuin videon katsojankin edes- 
sä (esimerkki 68). 


68) Ystävykset ylittävät sillan. (trFitt49-045) 


Videon 045 kielensi ylittää-verbillä 19 koehenkilöä, kun muiden silta- 
videoiden kohdalla verbin osuus vaihtelee 0-5 esiintymän välillä. Ver- 
tailukohtien vähyys mahdollistaa kuitenkin vain alustavia arvioita sii- 
tä, miksi ylittää-verbi on niin yleinen juuri tässä videossa. Video 045 
poikkeaa muista siltavideoista kuvakulmaltaan, ja on mahdollista, että 
suoraan eteen aukeava silta tuottaa enemmän ylittää-verbiä. Toisaalta 
muihin videoihin liittyy erityyppistä liiketilanteen kompleksisuutta: vi- 
deoissa 046 ja 047 on toinen, ohitettava kiintopiste, ja videon 050 liike- 
tilanteen rajattuus on tulkinnanvaraisempaa. 
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KIINTOPISTEENA PORTAAT 

Elisitaatiokehyksessä on kuusi videota, joissa kulkureitti-kiintopistettä 
edustavat portaat. Kaikissa niistä näkyy portaiden kiipeäminen joko ko- 
konaan tai lähes kokonaan (ks. taulukko 20). Neljässä tarkastelluista vi- 
deoista on portaiden lisäksi selvästi näkyvillä toinen kiintopiste: Videois- 
sa 022 ja 029 on mukana siirtymä luolaan portaiden lopussa tai ulos 
luolasta portaiden alussa, ja videoissa 073 ja 074 poistuminen veden 
ääreltä tai saapuminen veden äärelle. Samansuuntaista liikettä erilaisis- 
ta kuvakulmista kuvaavat videot 070 ja o71 keskittyvät selvemmin por- 
taissa kulkemiseen, mutta niissäkin on videon lopussa nähtävissä, että 
nainen saapuu jonnekin, mahdollisesti luolan päälle. 


Taulukko 20. Väylän ja suunnan ilmaisukeinojen osuus videoista, joiden kiintopisteenä 
ovat portaat. 


Video Kuva- Väylä: Suunta: Suunta: Suunta: PAIKKA Väylän 
kulma totaali- partitiivi pitkin- — partitiivi ALKU tai 
objekti ilmaus + pitkin- LOPPU 
ilmaus 
022: Nainen edestä 7/50 28/50 — 11/50 - - 4/50 


kävelee portaita 
alas luolaan 


029: Nainen takaa 5/50 21/50 19/50 - - 5/50 
kävelee portaita 

ylös luolasta 

070: Nainen edestä 3/50 31/50 13/50 2/50 = 1/50 
kävelee portaat 

ylös (luolan 

päälle) 

o71: Nainen takaa 3/50 36/50 8/50 2/50 - 1/50 
kävelee portaat 

ylös (luolan 

päälle) 

073: Nainen takaa 9/50 24/50 8/50 - - 9/50 
kävelee portaat 

alas veden äärelle 


074: Nainen sivusta 5/50 29/50 6/50 1/50 - 9/50 
kävelee portaat 
ylös veden ääreltä 


Portaat mainitaan valtaosassa kielennöksiä, vaikka osassa videoista on 
mukana myös väylän ALUN tai LOPUN rajanylitys, joka aineistossa ylei- 
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sesti tulee laajasti kielennetyksi.4* Taulukon 20 oikeanpuoleisessa sa- 
rakkeessa on niiden kielennösten osuus, joissa ei ole kielennetty väylän 
KESKIVAIHETTA, suuntaa tai PAIKKAA vaan niiden sijaan väylän ALKU tai 
LOPPU, kuten luolaan saapuminen tai sieltä poistuminen. On toden- 
näköistä, että portaat on kiintopisteenä niin silmiinpistävä eli salientti 
(landmark salience, esimerkiksi Caduff & Timpf 2008), että koehenkilöt 
huomioivat sen helposti myös kielennöksen tasolla. Portaat-kiintopiste 
siis erottuu aineiston muista kiintopisteistä siinä mielessä, että se tulee 
osassa kielennöksiä ilmaistuksi ainoana kiintopisteenä, vaikka videolla 
näkyy toiseen kiintopisteeseen liittyvä rajanylitys. Ero käy ilmi, kun 
porrasvideoita verrataan esimerkiksi videoon 027, jossa nainen poistuu 
metsästä ja lisäksi kuvataan pitkään naisen kävelyä nurmikolla. Kaikki 
koehenkilöt huomioivat naisen poistumisen metsästä. Osa huomioi li- 
säksi kielennöksessään nurmikolla kävelyn, mutta se ei yhdessäkään 
kielennöksessä syrjäytä rajanylityksen eli metsästä poistumisen ilmai- 
sua. Porrasvideoista sen sijaan on tyypillistä esimerkin 69 tapaan maini- 
ta ainoastaan portaita pitkin eteneminen ja jättää luolasta poistuminen 
mainitsematta. 


69) Nainen astelee portaita pitkin. (trFitt26-029) 


Rajatun väylän KESKIVAIHEEN ilmaisukeinoa, totaaliobjektia (Nainen 
nousee portaat), käyttää pieni osa (3-9) koehenkilöistä kustakin videosta. 
Tyypillisimmin portaissa eteneminen ilmaistaan rajaamattomana suun- 
tana. Kaikista videoista eniten käytetty (21-36 koehenkilöä) ilmaisukeino 
on portaita-tyyppinen partitiiviobjekti, vaikka useimmissa videoissa ti- 
lanne on selkeästi rajattu joko väylän ALUN tai LopuN suhteen. Melko 
paljon on käytetty myös pitkin-ilmauksia (6-19 koehenkilöä). Muutamas- 
sa kielennöksessä on sekä pitkin-ilmaus että toista kiintopistettä käyttä- 
vä partitiiviobjekti, kuten esimerkissä 70. Sen sijaan PAIKKA-ilmauksia 
(portaissa / portailla) ei käytetä portaat-kiintopisteestä lainkaan. 


46 Tarkastelua ei ole rajattu lekseemiin portaat, vaan mukaan on laskettu kaikki lekseemit, joilla on kie- 
lennetty videoilla näkyvä kulkureitti. Lekseemin portaat lisäksi mukana on siis sen lähisynonyymejä, 
kuten raput ja rappuset, sekä yksittäisiä tapauksia, joissa luonnontilaiset, sammaloituneet portaat on 
tulkittu (kivi) poluksi. 
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70) Mies juoksee polkua myöten mäkeä ylös. (trFi#t0-037) 


Kiintopiste portaat on vertikaalinen, mikä tuo sen ilmaisun tarkasteluun 
mukaan vertikaalista suuntaa ilmaisevat kielenainekset. Vertikaalisia kie- 
lenyksiköitä eli grammeja ylös, alas, ylöspäin ja alaspäin tai verbejä nous- 
ta, laskeutua, kiivetä ja kivuta käytetään 78,5 prosentissa porrasvideoiden 
kielennöksistä. Portaat ja muut siirtymät erityisesti rakennusten sisällä 
erottuvat myös Koulu- ja Unelmakorpuksessa keskeisenä kontekstina 
vertikaalisille grammeille, joita esiintyy kaikenikäisten teksteissä. Lap- 
silla tyypillinen konteksti näille grammeille on myös mäenlasku, johon 
kuuluu laskeminen mäkeä alas ja kiipeäminen takaisin ylös. 
Seuraavaksi tarkastelen kiintopisteen portaat eri ilmaisukeinojen 
yhdistymistä vertikaalista suuntaa ilmaiseviin kielenaineksiin porras- 
videoissa (ks. taulukko 21). Totaaliobjektilla ilmaistun väylän yhteydessä 
on vertikaalisen suunnan ilmaus yhtä lukuun ottamatta kaikissa kielen- 
nöksissä, ja monissa ilmaisu on jakaantunut verbin ja grammin kesken 
(esimerkki 71). Siinä yhdessä kielennöksessä (esimerkki 72), jossa verti- 
kaalisuutta ei ilmaista, mukana on kuitenkin päätepisteen ilmaisu ihan 
veden rajaan asti. Totaaliobjektia ei siis käytetä ainoana liikeradan spe- 
sifikaationa, vaan sitä täydentää jokin muu väylän tai suunnan ilmaus. 
Keksitty esimerkki 73 onkin intuitiivisesti hyväksyttävyyden rajamailla. 


71) Nainen laskeutui portaat alas. (trFi##27-022) 

72) Nainen kävelee kiviset raput ihan veden rajaan asti ja jää katsele- 
maan veteen. (trFi#18-073) 

73) Nainen kävelee portaat. 


Taulukko 21. Vertikaalisen suunnan ilmaisu videoissa, joissa kiintopisteenä on portaat. 


Ilmaisukeino % Vertikaalisen Fi vertikaalisen 
suunnan ilmaisu suunnan ilmaisua 
Totaaliobjekti (n = 32) 96,9 3,1 
Partitiiviobjekti (n = 169) 92,3 7,7 
pitkin-ilmaus (n = 65) 55,3 44,6 
Partitiiviobjekti + pitkin-ilmaus (n = 5) 100 - 


47 Totaaliobjektin portaat voisi ajatella muodostavan luontevan lauseen lähinnä erityisessä kontekstissa, 
kuten pitkistä portaista koostuvan liikuntasuorituksen yhteydessä (Kävin juoksemassa Pispalan portaat). 
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Totaali- ja partitiiviobjektin välillä ei ole suurta eroa yhdistymisessä verti- 
kaalisiin kielenaineksiin. Partitiiviobjekti yhdistyy vertikaalisen suunnan 
ilmaisuun 92,3 prosentissa käytöistään. Edempänä pohdittiin grammien 
ylös ja alas asettumista väylän ja suunnan rajamaille, tapauskohtaisesti 
määrittyviksi. Grammien ylöspäin ja alaspäin todettiin edustavan päin- 
partikkelin ansiosta selvemmin suuntaa. Objektin sijan ja vertikaalisen 
grammin yhdistelmät asettuvat rajattuuden suhteen jatkumolle: Raja- 
tuinta päätä edustaa totaaliobjektin ja lyhyen grammin yhdistelmä, ku- 
ten portaat alas, jossa totaaliobjekti on rajattu elementti ja sen ohella 
alas-grammi voi myös saada rajatun tulkinnan. Välivaiheille sijoittuu 
partitiiviobjekti lyhyen grammin kanssa, kuten ilmaus portaita alas, 
jossa portaita on rajaamaton ilmaus mutta alas on mahdollista tulkita 
joko rajatuksi tai rajaamattomaksi. Selvimmin rajaamattoman tulkinnan 
saa portaita alaspäin -tyyppinen rakenne, jossa sekä partitiiviobjekti että 
päin-päätteinen grammi ovat rajaamattomia elementtejä. 

Kielennöksissä, joissa liikerataa ilmaisee pitkin-ilmaus, vertikaalisen 
suunnan ilmaisu ei ole yhtä yleistä kuin pelkän partitiivi- tai totaaliobjek- 
tin kanssa: vertikaalinen suunta on ilmaistu 55,3 prosentissa kielennök- 
sistä (esimerkki 74). Lähes yhtä yleistä on siis jättää vertikaalinen suunta 
spesifioimatta esimerkin 69 tapaan. 


74) Nainen nousi pientä polkua pitkin ylös. (trFitts-070) 


Syy vertikaalisten ilmausten suhteelliseen vähyyteen pitkin-ilmausten 
yhteydessä ei käy suoraan ilmi aineistosta, mutta on mahdollista, että 
kyse on kompleksisten rakenteiden välttämisestä: esimerkiksi polkua 
ylös on yksinkertaisempi ilmaisu kuin kahden grammin ketjuttaminen 
polkua pitkin ylös -rakenteeseen. 


Lopuksi 
Tämän luvun tavoitteena on ollut luoda katsaus tiettyjen keskeisten spa- 
tiaalisten merkitysten, rajattua liikerataa edustavan väylän ja rajaamaton- 


ta liikerataa edustavan suunnan, ilmaisuun suomen kielessä. Kehityksel- 
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linen variaatio on kontrolloitu rajaamalla koehenkilöjoukko nuoriin tai 
nuorehkoihin aikuisiin. Väylän KESKIVAIHEEN ja suunnan ilmaisua on 
tarkasteltu esittelemällä niiden ilmaisukeinoja laajassa elisitaatiokehyk- 
sellä kootussa liikeilmausten aineistossa. Ilmaisukeinoja on analysoitu 
semanttisesti ja niiden käyttöä on tarkasteltu erilaisia liiketilanteita ku- 
vaavien videostimulusten yhteydessä. Aineiston erityyppisten videoiden 
tuottamaa ilmaisua tarkastelemalla on tarkennettu kuvaa siitä, miten 
väylän ja suunnan merkitykset rakentuvat suomessa ja minkätyyppisiin 
liiketilanteisiin liittyy variaatiota suomen kielen puhujien kesken. 
Spatiaalinen merkitys on tässä luvussa nähty holistisena: se jakaantuu 
eri kielenyksiköiden kesken ja rakentuu sekä kieliopillisten että leksikaa- 
listen elementtien kautta. Tutkimuksessa tunnistettiin suomen liikkeen 
ilmaisussa käytetyistä kielenyksiköistä myös tilanteista variaatiota siinä, 
millaista merkitystä ne missäkin kontekstissa ilmaisevat. Esimerkiksi 
grammi pois ja vertikaaliset grammit ylös ja alas voivat liittyä vaihtelevas- 
ti sekä väylän että suunnan ilmaisuun, eikä raja merkitysten välillä ole 
aina ilmiselvä. Lisäksi kiintopisteenä toimiva lekseemi vaikuttaa keskei- 
sesti vaylagrammien ja -verbien merkitykseen spatiaalisen merkityksen 
distribuution (Sinha & Kuteva 1995) hengessä: esimerkiksi sillan yli ja 
ylittää silta kuvaavat erilaista liikerataa kuin tien yli ja ylittää tie. 
Erityisesti väylän KESKIVAIHEESEEN keskittyvistä videoista nousee 
esiin suomen kielen laajojen, vaihtoehtoisten resurssien luoma variaatio. 
Suomessa KESKIVAIHEEN grammeja on useita, ja usein yhden liiketilan- 
teen kuvaamiseen on monia eri vaihtoehtoja (esimerkiksi poikki, halki, 
läpi ja yli). Grammien variaatio näyttää olevan suomessa suurta myös 
typologisten yleistysten valossa (vrt. Papahagi 2011), ja lisäksi KESKI- 
VAIHE voi tulla ilmaistuksi verbeissä tai objektin sijassa. Jatkotutkimuk- 
sen tehtäväksi jää verrata tätä ilmaisun aluetta yksityiskohtaisemmin 
suomen ja muiden kielten välillä. Myös suunnan ilmaisun keinoja on ai- 
neistossa runsaasti. Niiden tapauksessa moninaisuutta selittää osaltaan 
myös tilanteiden laaja kirjo: rajaamattomiin liiketilanteisiin kuuluu paitsi 
rajaamattomalla liikeradalla liikkumista (esimerkiksi tietä pitkin, portai- 
ta) myös loittonemista (esimerkiksi luolasta poispäin), lähestymistä (esi- 
merkiksi luolaa kohti) sekä liikettä vertikaalisella (esimerkiksi ylöspäin), 
lateraalisella (esimerkiksi oikealle) ja frontaalisella (esimerkiksi eteen- 
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päin) akselilla. Myöhemmin on analysoitava, miten näin kompleksisessa 
ilmiössä osaaminen yhdenmukaistuu ja kielellisten resurssien käyttö 
monipuolistuu ja miten kehitys suhteutuu muiden spatiaalisten mer- 
kitysten, kuten väylän ALUN ja Lopun ilmaisuun. Väylän KESKIVAIHEEN 
ja suunnan ilmaisua tarkasteltiin paitsi koko aineistosta myös tapaus- 
tutkimuksen omaisesti niistä videoista, joissa on kiintopisteenä ihmisel- 
le tyypillinen kulkureitti. Niissä rajattu väylän KESKIVAIHE sekä rajaamat- 
tomat suunta- tai PAIKKA-ilmaukset hahmottuvat usein vaihtoehtoisiksi 
tavoiksi käsitteistää liiketilanne. Samoista videoista on käytetty esimer- 
kiksi ilmauksia sillan yli ja siltaa pitkin, joista ensimmäinen ilmaisee 
tilanteen rajattuna ja jälkimmäinen rajaamattomana. 

Variaatiota keskittyy tiettyihin videoihin, ja joissakin tapauksissa se 
liittyy selvästi monitulkintaisuuteen, kuten videossa 050, jossa kahden 
tai mahdollisesti useammankin sillan muodostama polkurakennelma on 
jokseenkin poikkeuksellinen ja vaikeasti kuvailtavissa. Eroja hahmottuu 
kuitenkin myös suhteessa kiintopisteen tyyppeihin. Esimerkiksi pitkin- 
tyyppisillä grammeilla ilmaisua liittyy odotuksenmukaisesti eniten videoi- 
hin, joiden kiintopisteenä on pitkä ja kapea polku. Kiintopisteen portaat 
yhteydessä taas esiintyy lähes poikkeuksetta vertikaalista suuntaa ilmai- 
seva elementti ja ylipäätään vahvaa suuntaisuutta sikäli, ettei PAIKKA- 
ilmauksia käytetä lainkaan videoista, joissa kulkureittinä käytetään por- 
taita. Teiden, polkujen ja siltojen kanssa PAIKKA-ilmauksia esiintyy jon- 
kin verran, vaikka ne pääasiassa liittyvätkin aineistossa laajempaa aluetta 
kuvaaviin kiintopisteisiin. Portaat näyttäytyvät aineistossa myös niin huo- 
mion kiinnittävänä kiintopisteenä, että ne mainitaan lähes aina ja usein 
myös ainoana kiintopisteenä, vaikka videolla näkyisi tyypillisesti huo- 
miota herättävä rajanylitystilanne. Kiintopisteiden salienssiin liittyvä 
variaatio jää odottamaan myöhempää, perusteellisempaa kartoitusta. 

Tässä luvussa esitetty analyysi ei pyri yksiselitteisesti vastaamaan sii- 
hen, voiko suomen luokitella Talmyn (2000b) tapaan satelliittikehys- 
kieleksi vai pitäisikö sen katsoa edustavan muuta tyyppiä, mahdollisesti 
yhdessä muiden sijakielten kanssa (ks. Naidu ja muut 2018). Tämän 
kysymyksen tarkastelu edellyttää myös liikkeen ilmaisun muiden osa- 
alueiden, kuten väylän ALUN ja LoPUN analyysiä (ks. Tuuri & Belliard, 
tulossa). Tästä tarkastelusta kuitenkin selviää esimerkiksi se, että väylän 
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KESKIVAIHEEN ja suunnan ilmaisussa tapaverbit ovat selvästi keskeisin 
verbiluokka, vaikka suomessa on myös tavan suhteen neutraaleja väy- 
läverbejä, kuten ylittää ja ohittaa, sekä suuntaverbejä, kuten nousta ja 
laskeutua. 

Tässä tutkimuksessa nouseva kuva liikeradan kielentämisestä suo- 
messa tukee myös osaltaan liikeilmausten kieltenväliseen vertailuun pe- 
rustuvia käsityksiä satelliittikehyskieliksi määriteltyjen kielten ilmaisun 
moninaisuudesta (esimerkiksi Slobin 2004; Ibarretxe-Antufiano 2009). 
Sen lisäksi, että satelliittikehystystä suosivat kielet ilmaisevat tapaa ver- 
bikehyskieliä monipuolisemmin (esimerkiksi Slobin 2006), ne sallivat 
tyypillisesti myös laajempaa väyläinformaation ilmaisua (ks. esimerkiksi 
Berman & Slobin 1994, 118-119; Pajunen 2001, 210). Ibarretxe-Antufiano 
(2009, 410) pitää laajoja leksikaalisia ja morfologisia resursseja yhtenä 
väylän korosteisuutta lisäävänä ja selittävänä tekijänä: esimerkiksi bas- 
kin yhdistelmä väyläverbejä, paikallissijoja, lokatiivisia adpositioita ja 
relationaalisia substantiiveja johtaa laajempaan väylän ilmaisuun kuin 
muissa perinteisesti verbikehyskieliksi määritellyissä kielissä. Tämän 
tarkastelun perusteella huomattavaksi nousee se, että suomen ilmaisu- 
varannot näyttäytyvät laajoina myös väylän KESKIVAIHEEN merkityksessä, 
jonka on esitetty olevan semanttiselta granulariteetiltaan kielissä tyypil- 
lisesti niukka (Papahagi 2011). 

Aineiston rajaamisessa tiettyjen stimulusten avulla on sekä etunsa 
että haasteensa. Metodi mahdollistaa systemaattisen vertailun eri näkö- 
kulmista, esimerkiksi kielten, puhujayksilöiden ja erilaisten stimulus- 
tyyppien välillä. Elisitoimalla saadaan kielennöksiä juuri niistä tilanteis- 
ta, joita halutaan tarkastella. Samalla kuitenkin saadaan kielennöksiä 
vain niistä tilanteista, joita stimuluksiin on sisällytetty. Virikemateriaalin 
ominaisuudet saattavat vaikuttaa kielennöksiin osin ennakoimattomilla 
tavoilla; esimerkiksi Özcaliskan (2015) epäilee, että videoformaatti saat- 
taa lisätä liikkumisen tavan kielentämistä. Elisitaatiotilanne on myös 
kielenkäyttötilanteena erikoislaatuinen, mikä saattaa joiltakin osin vai- 
kuttaa kielennöksiin. Esimerkiksi mennä-verbin käyttö väylän KESKIVAI- 
HEESSA (mennä ohi -tyyppiset rakenteet) on aineistossa vähäistä, mikä 
viittaa osaltaan siihen, että monella kielentäjällä elisitoitu aineisto edus- 
taa arkipuhekieltä muodollisempaa rekisteriä. Kokonaiskuvan saavut- 
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tamiseksi tarvitaan siis myös muunlaista aineistoa. Toisaalta alustava 
vertailu Unelmakirjoitelmiin viittaa siihen, että elisitaatiotehtävä tuottaa 
suhteellisen todenmukaista kuvaa suomenkielisten nuorten aikuisten 
spatiaalisen sanaston käytöstä: lähes kaikki elisitoidussa aineistossa käy- 
tetyt väylän KESKIVAIHEEN grammit ovat mukana myös nuorten aikuis- 
ten kirjoitelma-aineistossa ja suunnan ilmaisut ovat niin ikään samoja. 
Alakouluikäisillä vastaavia grammeja on vähemmän, niitä käytetään 
harvemmin ja usein käyttö vaikuttaa vakiintumattomalta, joten väylän 
ja suunnan kielentämistä kannattaa tarkastella myös kehityksellisestä 
näkökulmasta. 
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Johdanto 


Kertominen on ihmismielelle ominainen tapa kuvata tapahtumia. Ker- 
ronnan tuloksena syntyy teksti, kertomus, joka esittää kokemamme tai 
kuvittelemamme tapahtumat toisiinsa liittyvinä tapahtumaketjun osina. 
Juuri kertomusten avulla ihminen voi ymmärtää, muistaa ja jakaa niin 
kokemuksia kuin tapahtumiakin (Pietikäinen & Mäntynen 2009, 105). 
Samaistumisen edellytyksenä on kuitenkin, että teksti on myös sen vas- 
taanottajalle ymmärrettävä eli koherentti. Koherentti, yhtenäinen kerto- 
va teksti syntyy monen tekijän summana, mutta perusedellytys on, että 
tilanne, tapahtumat ja henkilöt ankkuroidaan diskurssiin. Tämä tarkoit- 
taa, että tapahtumia kielentävät lauseet on suhteutettava temaattisesti, 
ajallisesti ja paikallisesti sekä toiminnallisesti — tekstillä on toisin sanoen 
oltava tietty teema, ja se tulee sijoittaa aikaan ja paikkaan. 
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Koherentissa kertomuksessa tapahtumat kerrotaan suhteessa valittui- 
hin henkilöihin. Myös henkilöt on aluksi esiteltävä diskurssiin ja sen jäl- 
keen merkittävä tekstissä tunnistettavasti. Koherentissa kertomuksessa 
tapahtumat eivät etene sattumanvaraisesti vaan kielentyvät yleensä sar- 
jana joko kertomusrakenteen tai juonirungon eli skriptin mukaisesti 
(Hickmann 2004; Givön 2017, 57-64). Tapahtumat asetetaan tärkeys- 
järjestykseen, mitä voidaan havainnoida esimerkiksi tutkimalla virkkei- 
den tai T-yksiköiden rakennetta eli sitä, miten yhteen rakenneyksikköön 
kielennetään päätapahtuman lisäksi sitä taustoittavat, perustelevat tai 
muut vastaavat tapahtumat (ks. T-yksiköistä esim. Schneider, Vis Dubé 
& Hayward 2005). Koko tapahtumasarja voidaan puolestaan esittää joko 
tapahtumajärjestyksen mukaisesti, takaumin, tiivistetysti tai yksityiskoh- 
taisesti. Kertomuksen kirjoittaja voi siis pakata kokonaisuuden siten, 
että informaatio välittyy vastaanottajalle halutuin painotuksin ja että tut- 
tu ja uusi informaatio erottuvat toisistaan. 

Yksi oleellinen koherenssia luova tekijä on juuri referentiaalisten eli 
viittaavien ilmauksien käyttö. Niiden avulla viestin vastaanottaja pystyy 
identifioimaan puheena olevat tarkoitteet kaikkien vaihtoehtojen joukos- 
ta oikein: hän tietää tai päättelee, kuka tekee mitäkin ja kenelle jotain 
tapahtuu. Tarkoite, diskurssireferentti, tuodaan tekstiin esimerkiksi esit- 
telyrakennetta käyttäen ja siihen viitataan jatkossa käyttäen pronomineja 
tai referentiaalisia määräisiä ilmauksia (ks. Halliday & Hasan 1976; 
Bamberg 1983; Hickmann 2004; Habermas & de Silveira 2008; Givön 
2017). Tämän luvun teemana on analysoida, miten koherenssi syntyy 
kehityksellisessä kontekstissa juuri referentiaalisten ilmauksien ja kerto- 
van tekstin yhteistyönä. Tarkastelu rajautuu erityisesti kontekstissaan 
määräisiin ilmauksiin. Aineistona on Koulukorpuksen Unelmakirjoitel- 
mia (ks. Pajunen, Puranen & Yli-Paavola 2010; ks. myös tämän teoksen 
johdantoa). 

Semanttis-pragmaattisena ilmiönä koherenssia ilmaistaan viittaus- 
suhteiden lisäksi monilla muillakin keinoilla (Halliday & Hasan 1976), 
ja sitä voidaan tutkia niin kielellisen muodon ja merkityksen kannalta 
kuin kehityksellisestä näkökulmasta eli keskittyen koherenssin esiinty- 
vyyteen autenttisissa, eri-ikäisten kirjoittajien kirjoittamissa teksteissä. 
Jo se, miten esimerkiksi referentiaalinen koherenssi määritellään — yh- 
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den tekstiyksikön tulkinta riippuu jostakin toisesta yksiköstä — osoittaa, 
että koherenssi joka tapauksessa on tekstitason eli tapahtumien kielen- 
tämisen tason ilmiö. 

Informaation kulkua tekstissä voidaan osoittaa tekstireferenttien tois- 
tuvuudella eli muun muassa topiikin jatkuvuuden avulla. Topiikin jatku- 
vuus kertovassa tekstissä osoitetaan tyypillisesti kertojaan tai henkilöön 
viittaavilla persoonapronomineilla (Genette 1980). Viittausketjujen pi- 
tuutta rajaa ymmärrettävyys ja toistoa tarvitaan erityisesti jaksojen raja- 
kohdissa. Pitkät viittausketjut ovat ominaisia kertovalle tekstille, mutta 
erittelevässä tekstissä koherenssi nojaa enemmän leksikaalisiin keinoi- 
hin. Informaation kulku käy ilmi myös diskurssireferenttien merkin- 
nästä, jota tässä yhteydessä tutkitaan. Ilmiön moninaisuus antaa olettaa, 
että koherenttien ilmausten ja tekstien tuottaminen ja ymmärtäminen 
on kehityksellisesti hidasta; tosin varsinainen tutkimustieto suomen 
osalta vielä pääosin puuttuu. 

Koherentin tekstin tuottaminen edellyttää vastaanottajan huomioon 
ottamista. Tekstin tuottajalla ja vastaanottajalla voi olla aiempaa tai muu- 
ten yhteistä tietoa tai sitten tuottaja joutuu päättelemään, mitä vastaan- 
ottaja tietää tai voi päätellä kontekstin, tilanteen tai sosiaalis-kulttuurisen 
tiedon perusteella. Jos vastaanottaja on tekstin tuottajalle läheinen, teh- 
tävä on helpompi kuin jos hän on etäinen tai jos vastaanottajana on 
heterogeeninen ryhmä. Kehityksellisesti tilanne on vielä hankalampi. 
Pikkulapset pystyvät suullisesti kertomaan koherentteja tarinoita jo reip- 
paasti alle kouluikäisinä (Suvanto 2012), mutta ne kerrotaan yleensä 
tutuille kuulijoille ja sanoman välittämiseen voidaan käyttää myös ei-ver- 
baalisia keinoja kuten ilmeitä ja osoituksia. Lisäksi osaamiseen vaikut- 
taa opittu malli eli esimerkiksi kuultujen satujen ja tarinoiden määrä. 
Tarinoiden siirtäminen kirjoitettuun muotoon tuo monia lisävaikeuksia 
ja -vaatimuksia alkaen motorisista valmiuksista aina kognitiiviseen kyp- 
syyteen (Hoff 2009). Erityisesti tekstin tuottajalla pitää olla kyky kuvi- 
tella, mitä vastapuoli tietää ja ymmärtää, näkee tai kokee. Hänellä toisin 
sanoen pitää jo olla kehittynyt mielen teoria (ks. esimerkiksi Astington 
& Baird 2005). 

Unelmakirjoitelmat edustavat annetusta teemasta vapaasti kertomis- 
ta, vaikka aiheen rajaus yhteen päivään (Unelmieni päivä) antaa kirjoitta- 
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jalle mahdollisuuden tukeutua päivä-skriptiin. Aineistosta on tutkimusta 
varten poimittu alakoulun jokaiselta luokalta 8 000 tekstisanaa. Tutki- 
mus rajautuu alakouluikäisiin, koska voi olettaa, että koherentin tekstin 
tuottaminen on juuri heillä vielä vaiheessa (Pajunen 2012). Aineiston 
kokonaissanamäärä on 40 000 sanaa (eli 60 % ko. luokkien teksteistä), 
mutta analyysi keskittyy erityisesti toisen, neljännen ja kuudennen luo- 
kan aineistoon, jotta kehitykselliset erot näkyvät selvästi.4$ Teksteistä on 
analysoitu funktioltaan referentiaalisiksi arvioitavat ilmaukset. 
Tutkimus etenee seuraavasti. Ensin luodaan tutkimuksen teoreetti- 
nen konteksti ja määritellään keskeiset käsitteet. Pohdimme diskurssi- 
referentteinä toimivien tarkoitteiden jakoa tuttua ja uutta informaatiota 
ilmaiseviin. Lisäksi tarkastelemme referentiaalisen koherenssin ymmär- 
tämis- ja tuottamistutkimusta kehityskontekstissa sekä kertovan tekstin 
luonnetta ja kehitystä. Luvun empiirisessä osiossa käsittelemme ala- 
kouluikäisten referentiaalisen koherenssin ilmaisun kehittymistä mää- 
räisten ilmauksien näkökulmasta. Oheisjuonteena kulkee puhutussa 
suomessa melko tavallisen artikkelinomaisen se-tarkenteella merkityn 
lausekkeen esiintyminen lasten kirjoitetussa kielessä. Oletuksena on, että 
alakouluikäisillä on vaikeuksia referentiaalisen koherenssin ilmaisussa, 
erityisesti päätellyn tai oletetun tuttuuden osalta, ja että kehitys suhteu- 
tuu kertomusrakenteen hallintaan saamiseen. Puheessa alakouluikäi- 
set lapset sekä ymmärtävät että tuottavat korrekteja viittaussuhteita mut- 
ta etenkin luovassa kirjoittamisessa kehitys on oletettavasti vielä kesken. 


Referentiaaliset ilmaukset ja kertova teksti 


Kehityksellisessä kontekstissa referentiaaliset, tunnistettaviin tarkoittei- 
siin viittaavat ilmaukset synnyttävät koherenttia tekstiä vaiheittain. Teks- 
tit ovat nuorimmilla kirjoittajilla aluksi vailla koherenssia, sitten osittain 
koherentteja ja vähitellen syntyy koherentti kertomus. Vastaavasti refe- 


48 Luokkakohtaisen otoksen koko määräytyi 2. luokan aineiston sanamäärästä. Ylemmiltä luokilta valittiin 
juoksevassa järjestyksessä yhtä monta tyttöjen ja poikien kirjoitelmaa. 1. luokan aineistossa oli paljon 
yhden sanan kirjoitelmia, joten sitä ei kannattanut sisällyttää analyysiin. 
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rentiaalisten ilmausten tuttuus on moninaista ja aluksi monilla ilmaisu- 
keinoilla toteutettavissa. Lapsen kyky tulkita ilmauksien koherenssia on 
vaiheittaista aivan samoin kuin sen tuottaminenkin. Oletuksemme 
onkin, että vaikka kertova teksti edellyttää koherenssia luovia referen- 
tiaalisia ilmauksia, kehitys on hidasta ja alakouluikäisillä vielä kesken- 
eräinen. Määrittelemme tässä luvussa analyysissä tarvittavat keskeiset 
käsitteet tarkemmin. 


TUTTU JA UUSI INFORMAATIO 
Referentiaalisten ilmauksien eli tekstin diskurssireferentteihin viittaa- 
vien ilmauksien ymmärtäminen edellyttää viestin vastaanottajalta maa- 
ilmantietoa, kontekstin ymmärrystä ja tekstin tulkintaa. Jos aihepiiri ja 
sisältö ovat vastaanottajalle kokonaan vieraita, hän ei näe toisen kannalta 
täysin koherenttia tekstiä koherentiksi, ei irrota siitä samaa merkitystä 
eikä huomaa sen sävyjä. Esimerkiksi 2020-luvun nuorten toisin kuin 
vanhempien ihmisten voi olla vaikea ymmärtää, mitä eroa on viittauksel- 
la vaikkapa 1950-luvun tai 1970-luvun Kekkos-aikaan, koska ymmärtä- 
minen edellyttää paitsi kyseisen henkilön myös näiden vuosikymmen- 
ten yhteiskunnallis-poliittisten tapahtumien ja ennen kaikkea ilmapiirin 
tuntemusta. Vähimmällä ne ymmärtää ajanjaksot kokenut. 
Koherenttiuden aste voi vaihdella myös muista syistä kuin vastaan- 
ottajan tiedon vaihtelun takia. Tekstin tuottaja voi esimerkiksi olla vielä 
sellaisessa kehityksellisessä vaiheessa, että hän ei hallitse koherenssin 
tuottamisen kielellisiä keinoja. Bamberg (1983) asettaa tekstikoherenssin 
asteikolle täydestä koherenssista osittaiseen, epäkoherenttiin, ei-ymmär- 
rettävään ja edelleen aina tekstittömyyteen (unscorable) asti. Täysin kohe- 
rentti teksti tunnistaa topiikin, pysyy aiheessa, orientoi lukijaa ja kertoo 
johdonmukaisessa järjestyksessä. Epäkoherentti teksti listaa aiheita nos- 
tamatta mitään niistä keskeiseksi, ei anna lukijalle orientoivaa tietoa jne. 
Yhden lauseen tai virkkeen tuotos ei muodosta tekstiä lainkaan. Gundel, 
Hedberg & Zacharski (1993) asettavat referentiaaliset ilmaukset annet- 
tuusasteikolle (givenness scale), jossa tietty kognitiivinen status merkitään 
tietyllä kielellisellä keinolla, esimerkiksi tuttuun referenttiin viittaava 
ilmaus merkitään artikkelikielissä määräisellä artikkelilla. Alakoululaiset 
todennäköisesti vasta tavoittelevat koherenttien viittausten tuottamista 
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ja niiden ilmaisemisen korrektia kielellistä keinoa. Voi olettaa, että nuo- 
rimpien alakoululaisten tekstit ovat koherenssiasteikon alapäässä ja että 
ne vähitellen kehittyvät iän mukaan asteikon yläpäätä tavoitteleviksi. 

Referentiaalisen koherenssin kannalta oletus on, että koherenssiastei- 
kon yläpäässä tekstin osallistujat esitellään ja heihin viitataan tunnistet- 
tavasti, epäkoherentissa tekstissä saatetaan esitellä useita osallistujia, 
mutta heistä ei ole mainintaa enempää sanottavaa. Myös koherenssin 
ja kertomusrakenteen kannalta oleellinen vastaanottajan orientointi jää 
heikosti koherenteissa teksteissä vähiin. Epakoherentti kertova teksti 
voi silti olla vaihtelevasti ymmärrettävä. Ensinnäkin kertova teksti on 
ylipäätään helpompi tulkita kuin erittelevä, ja tapahtumien osittainenkin 
ankkurointi aikaan ja paikkaan auttaa hahmottamaan tekstiä. Unelma- 
kirjoitelmien kontekstissa sekä kirjoittajan ikä että kirjoitelman aihe an- 
tavat lukijalle monia tulkintavihjeitä. On esimerkiksi odotuksenmukais- 
ta, että nuoren kirjoittajan maailmassa perheenjäsenillä ja koululla on 
suuri rooli, joten lukija todennäköisesti pyrkii identifioimaan diskurssin 
henkilöitä perheenjäseniin tai luokkatovereihin, vaikka heitä ei erikseen 
esiteltäisi tai viittaussuhteita merkittäisi kognitiivista statusta vastaavalla 
tavalla. 

Referentiaaliset ilmaukset viittaavat siis joko tuttuun tai uuteen tie- 
toon. Fdellinen ilmaistaan esimerkiksi artikkelikielissä määräisillä muo- 
doilla tai pronomineilla, jälkimmäinen epämääräisillä artikkeleilla. Lähtö- 
kohtaisesti perusjako tuttu ja uusi vaikuttaa helpolta ymmärtää, mutta 
tosiasiassa erityisesti tuttuuden käsite on kirjallisuudessa saanut monia 
eri nimityksiä ja vaihtelevia tulkintoja. Ero selitti vanhemmassa alan 
kirjallisuudessa lähinnä syntaktisten rakenteiden käyttöeroja ja sana- 
järjestysvaihteluita, mutta tekstin pragmaattiseen tulkintaan ei kiinni- 
tetty huomiota (ks. esimerkiksi Chafe 1976; 1987; 1997). Prince (1981, 
225—231; 1992) oli ensimmäisiä, joka kiinnitti huomiota siihen, että tut- 
tuuden ja uutuuden vastakohtaisuutta (old-new, known-new, presupposi- 
tion-focus, given-new) ei ollut riittävästi määritelty ja että tuttuustermillä 
(given) saattoi olla ainakin kolme eri merkitystä. Ensinnä kysymys oli 
diskurssireferentin tunnistamisesta edeltävän kontekstin perusteella 
(predictability/recoverability), toiseksi salienssista eli jossain suhteessa 
huomion herättämisestä tai ilmeisyydestä ja kolmanneksi yhteisestä tie- 
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dosta (shared knowledge) tai oletetusta tuttuudesta (assumed familiarity). 
Prince osoitti myös, että nämä tekijät eivät ole itsenäisiä vaan toisistaan 
riippuvia ja monella tavoin tekstin tuottajan olettamuksiin liittyviä. 

Pääteltävä tuttuus on tuttuuden tyypeistä hankalin, ja Prince pyrkii 
antamaan sille useita tulkintoja, joiden mukaan puhuja ensinnäkin olet- 
taa, että kuulija voi tai voisi ennustaa tietyn kielellisen yksikön esiinty- 
vän tietyssä ilmauksessa ja tietyssä kohtaa lausetta. Toiseksi puhuja 
olettaa, että kuulijalle tulisi mieleen jokin tietty entiteetti ilmaisun kuul- 
lessaan, ja kolmanneksi, että kuulija tietää, olettaa tai voi päätellä tietyn 
asian (sitä välttämättä tietoisesti ajattelematta). Prince (1981, 237) on 
luonut tutun ja uuden laajalti tunnetun hierarkian (ks. taulukko 22), jos- 
sa osa tarkoitteista on täysin uusia, joko kontekstiin ankkuroimattomia 
tai tavalla tai toisella ankkuroituja. Osa on pääteltäviä siten, että ne joko 
sisältävät laajempaa tietoa tai eivät sisällä. Osa on esimerkiksi teksti- tai 
tilanneassosiaatioiden kautta aktivoituvia ja siten mahdollisesti tunnis- 
tettavia. 


Taulukko 22. Princen tuttuustaksonomia (1981, 237). 


Oletettu tuttuus Alaluokka Kiinnitys 
Uusi Täysin uusi Ankkuroimaton 
Täysin uusi Ankkuroitu 
Pääteltävä Sisältymätön 
Sisältyvä 
Aktivoitu (evoked) Tekstuaalisesti 
Tilanteisesti 


Vaikeasti arvioitavaa pääteltävyyttä on myöhemmässä kirjallisuudessa 
pyritty täsmentämään (ks. esimerkiksi Birner 2006; Loock 2013). Kuten 
luvun alussa jo todettiin esimerkin avulla, pääteltävyys on ongelmallista 
muun muassa, koska sen sisältyvyys voi olla rajaamatonta. Siten voi olla 
vaikea nähdä, miten laajoja yleistyksiä milloinkin voisi tai pitäisi tehdä. 
Abstraktikäsitteiden osalta pääteltävyys on erityisen hankalaa, koska jo 
niiden merkitys on kulttuurinen ja ehkä vain rajatusti yhteinen (Loock 
2013). Tekstin tuottajalla ja sen lukijalla voi myös olla hyvin erilainen kä- 
sitys entiteetin tuttuudesta, ja tämä ongelma on tavallaan ratkaisematon: 
tuottajan ja vastaanottajan teksti voi aina poiketa toisistaan (Sperber & 
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Wilson 1986). Birner (2006) on ehdottanut pääteltävien jaottelua vas- 
taanottajan kannalta tuttuihin ja uusiin. Loock (2013) on ehdottanut, että 
ongelmaa voi kuroa umpeen nojaamalla ns. kohteliaisuusoletukseen 
(vrt. Brown & Levinson 1987), jolloin viestin vastaanottaja tekisi erään- 
laisia hyväntahtoisia tulkintoja, yrittäisi seurata tekstin tuottajaa par- 
haansa mukaan ja ymmärtämään pyrkivästi. Toisaalta tekstin tuottaja 
voi tosin olla tarkoituksella epäkohtelias tehdessään vastaanottajan tie- 
dosta oletuksia ja vastaanottaja vastaavasti vastaanottamaton. Yksi tapa 
olisi Loockin (2013) mukaan lisätä Princen luokitukseen vastaanottajan 
määrittelemättömät tai ratkaisemattomat tapaukset eli kaikki sellainen, 
minkä sisältöä ei voi varmasti päätellä. Loockin mukaan nämä määritte- 
lemättömät tapaukset pyritään tekstiin merkitsemään tietyillä raken- 
teilla lisäämällä esimerkiksi määritteiden tai parenteesien määrää. Ne 
olisivat siten kielellisesti tunnistettavissa. Gundelin ja muiden (1993) 
annettuusasteikossa (givenness scale) on kuusi vastaanottajan mieleen 
oletettuun statukseen perustuvaa tilaa, jotka ovat implikatiivisessa suh- 
teessa: fokuksessa, aktivoitunut, tuttu (familiar), täysin identifioitavissa 
(uniguely identifiable), referentiaalinen ja tyypiltään tunnistettavissa (type 
identifiable). Tilat loisivat Gundelin ja muiden mukaan riittävät edellytyk- 
set spesifin referoivan ilmauksen tunnistamiseen tai saavutettavuuteen. 
Kehittyvässä kirjoittamisessa hierarkia näyttäytyy kuitenkin vielä selvästi 
osittaisena. 

Lähtökohtaisesti onkin ajateltavissa, että erityisesti lapsilla olisi ongel- 
mia yhteiseksi oletetussa tuttuudessa, että heillä olisi yliodotuksia vas- 
taanottajan tiedosta tai päättelykyvystä ja että he eivät hallitsisi kaikkia 
tarvittavia kielellisiä keinoja. Toinen vaihtoehto on luonnollisesti, että 
nuorimmat kirjoittamista vasta opettelevat eivät tule edes ajatelleeksi, 
että heidän pitäisi kirjoittaessaan ottaa joku lukijakin huomioon. Kerto- 
musrakennemalleissa oletetaan yhdeksi mallin osioksi tekstin henkilöi- 
den esittely tai yleensä orientaatio. Unelmakirjoitelmissa orientaatiojak- 
so on vielä viidesluokkalaisillakin melko harvoin mukana, mutta tekstin 
etukäteissuunnittelu nostaa sen esiintyvyyttä siten, että suunnitelluissa 
viidesluokkalaisten teksteissä noin 6o prosentissa on esittelevä osio (ks. 
Sintonen 2011). Toisin sanoen alakouluikäinen voi hyvin tuoda lukijalle 
uutta tietoa diskurssiin ilman esittelyä tai aikuisten käyttämiä merkintä- 
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keinoja. Hän voi myös olettaa itselleen tutun yhteiseksi tiedoksi tai muu- 
ten tutuksi. Perheenjäsenten lisäksi luokkatoverit ja ystävät ilmestyvät 
tekstiin usein ilman esittelyä. Oletus siis on, että nuorimmat kirjoittajat 
ilmaisevat oletettua tuttuutta ankkuroimalla sitä tilannekontekstiin ja 
kielenulkoiseen kontekstiin. Lukijan pitäisi siten vastaavasti rakentaa 
ymmärtämisensä kielenulkoiseen ja kulttuuriseen tietoon. 

Jossain määrin on avoin kysymys, kirjoittaako tekstin tuottaja juuri ja 
vain lukijaa huomioiden erottaessaan tuttua ja uutta informaatiota kie- 
lellisin keinoin, vai vaikuttaako hänen tuotokseensa myös muita tekijöi- 
tä. Arnoldin (2008) mukaan tekstin tuottajat pystyvät hyvin ottamaan 
huomioon vastaanottajan tarpeen ymmärtää referentiaalisia ilmauksia. 
He tekevät ensinnäkin eräänlaisia globaalioletuksia vastaanottajasta ja 
ottavat huomioon paitsi ymmärtämistarpeen, myös aiemman kokemuk- 
sen ja mahdollisen yhteisöllisyyden. Lisäksi he pystyvät ottamaan huo- 
mioon yksilöiden eroa viestin vastaanottamisessa. Tekstin tuottajat teke- 
vät myös eräänlaisia lokaalioletuksia siitä, mikä on huomion kohteena 
(aktivoituneena) eli ottavat referentin kognitiivisen statuksen huomioon. 
He vihjaavat statuksesta muun muassa syntaksin avulla: subjektin posi- 
tio on prominentein eli etualaisin, objektin seuraava ja niin edelleen. 
Positioiden prominenttijärjestykseen suhteutuu myös referentiaalisten 
ilmausten saavutettavuushierarkia (accessibility hierarchy). Osa päätöksis- 
tä perustuu Arnoldin mukaan kuitenkin selvästi muuhun kuin vastaan- 
ottajan huomioimiseen. Tuottajilla on taipumus huomioida esimerkiksi 
tekstin rakenteellinen tai temporaalinen raja, tekstin jaksotus, mikä voi 
perustua tarpeeseen selvitä omasta kognitiivisesta taakasta. Tekstin tuot- 
taja voi myös olla egosentrinen kirjoittaja, joko kehityksellisistä syistä 
tai muuten. 

Yhteinen tausta, tieto ja oletettu tuttuus vaikuttavat referentiaalisiin 
ilmauksiin, niiden tulkintaan ja tuottoon, mutta kirjallisuudessa termi- 
nologia, tulkinnat ja teoreettiset valinnat vaihtelevat. Serratrice ja Allen 
(2015) koostavat tätä keskustelua myös tutkimuksen kehittymisen ja tar- 
peellisen lisätutkimuksen perspektiivistä. Tässä yhteydessä leksikaali- 
sesti ilmaistu niin sanottu tuttu tieto jaotellaan kolmijaolla uudelleen- 
maininnat (konteksti, ilmeinen, päätelty), se-tarkenteella ilmaistut ja 
(kirjoittajalle) muuten tutut (eli uuteen tietoon ankkuroidut). Lisäksi on 
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pari pikkuryhmää, joihin palataan myöhemmin. Jaottelu pohjaa Princen 
taksonomian mukaiseen aineiston analyysiin ja osoittaa jo lähtökohtai- 
sesti, että alakoululaisaineistossa aikuistyyppisen oletetun tuttuuden 
luokitus on liian täydellinen. Usein esimerkiksi se, mikä on kirjoittajan 
mieleen aktivoitunut tai mikä hänen mielestään on tuttua, on lukijan 
pääteltävä yleistiedon varassa, so. ilman kielellisiä vihjeitä. 

Tutun ja uuden informaation erottaminen ja kielellinen merkintä on 
referentiaalisen koherenssin kannalta keskeistä. Henkilö- ja asiaviitteiset 
diskurssireferentit esitellään kielissä prototyyppisesti substantiivien 
luokkaan kuuluvilla tarkoitteilla, ja uusi tekstiin tuotu informaatio mer- 
kitään eri tavoin kuin tuttu: tämä on luonnollisesti analyysin perusta. 
Tapahtumiin viittaavia ilmauksia ei käsitellä tässä yhteydessä. 


REFENTIAALISEN KOHERENSSIN YMMÄRTÄMINEN JA 
TUOTTAMINEN 
Referentiaalisen koherenssin prosessointitutkimusta on tehty paljon ja 
hyvin monenlaisissa asetelmissa ja monenlaisten puheyhteisöjen yhtey- 
dessä. Tutkimus nojaa niin kielelliseen kuin visuaaliseen materiaaliin ja 
sekä ymmärtämis- että tuottotehtäviin. Prosessointitutkimus on yleensä 
kiinnostunut paitsi kompleksin kielen prosessoinnista etenkin sosio- 
pragmaattisen tiedon ja ei-kielellisen kontekstin ymmärtämisestä, toisin 
sanoen pitkälti juuri yhteiseksi oletetun ja pääteltävän tiedon ymmär- 
tämisestä. Kehityksellisen tutkimuksen rinnalla kulkee kielellisten eri- 
tyisryhmien testaus (ks. John, Rowe & Mervis 2009; Loukusa, Mäkinen, 
Gabbatorea, Laukkanen-Nevala & Leinonen 2017). Yleiskäsitys on, että 
tekstien koherenssi ja koheesio tyypillisesti lisääntyvät kielissä kehityk- 
sellisesti (Sonnenschein & Whitehurst 1983; 1984; Berman & Slobin 
1994, 40). Sekä aikuiset että lapset nojaavat referentin saavutettavuus- 
hierarkiaan siten, että korkea informaatio ja matala saavutettavuus 
kohdistavat huomion leksikaalisiin aineksiin ja matala informaatio ja 
korkea saavutettavuus pronomineihin ja pro-muotoihin (Serratrice & 
Allen 2015). 

Ymmärtämistutkimusten perusteella yleinen näkemys on myös, että 
lapset pystyvät noin 8-9 vuoden iässä toimimaan referentiaalisen kom- 
munikaation testeissä lähes aikuisen tavoin (ks. esimerkiksi Glucksberg, 
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Krauss & Higgins 1975; Ackerman 1979; 1981; Beal & Belgrad 1990). 
He toisin sanoen erottavat viittaussuhteiltaan epäselvät ja toisaalta infor- 
matiiviset ilmaukset ja ymmärtävät, mitä tuottaja on pyrkinyt sanomaan. 
Viiden kuuden vuoden iässä lapsilla on vielä suuria ongelmia tehdä eroa 
kirjaimellisen ilmaisun ja toisaalta tavoitellun merkityksen välillä, paitsi 
jos heille vihjataan eron mahdollisuudesta. Eroa on myös testityyppien 
tuloksissa: offline-testit tuottavat paljon variaatiota, jossa on mahdolli- 
sesti testihälyä, online-testit osoittavat, että 3-4-vuotiaiden katse kohdis- 
tuu kuuntelun yhteydessä tarinan kuviin — ja pronominien korrelaattei- 
hin — samantapaisesti kuin aikuisten mutta paljon hitaammin (Sekerina 
2015). Prosessoinnin nopeutuminen on sekin hidasta ja jatkuu pitkälle 
keskilapsuuteen. 

Kehityksellinen ymmärtämistutkimus myös osoittaa, että referentiaa- 
linen kommunikaatio ei nojaa yksin kielenhallintaan ja kielen keinoihin, 
vaan merkitseviä tekijöitä ovat niin lasten yleiset kognitiiviset kyvyt, toi- 
minnan ohjauksen taidot, heidän (reseptiivisen) leksikkonsa koko, kro- 
nologinen ikä kuin mielen teoria ja oikeastaan lukuisa joukko muitakin 
tekijöitä. Erityisesti referentiaalisessa kommunikaatiossa lasten kro- 
nologinen ikä ja myös mielen teoria selittävät tuloksia merkitsevästi 
(Ackerman 1981; Beal & Belgrad 1990; John ja muut 2009). Suomen 
osalta tutkimusta on vähän ja referentiaalisen kommunikaation ymmär- 
tämistä ei ole tietääksemme erikseen kokeellisesti tutkittu. Loukusan ja 
muiden (2017) pragmaattisen ymmärtämistutkimuksen tulosten mu- 
kaan 4-5-vuotiaat suomenkieliset lapset vastasivat referentiaalisia viit- 
tauksia laajemmalle ulottuviin mutta päättelemistä edellyttäviin sosio- 
pragmaattisiin kysymyksiin heikosti mutta 8-vuotiaat jo huomattavasti 
paremmin. Erityinen kehitysvaihe osui aikavälille 4-7 ikävuotta. — Myös 
ymmärtämistutkimuksen tulokset antavat olettaa, että ei ole odotettavis- 
sa, että esimerkiksi referentiaalisen koherenssin luominen onnistuisi 
vielä kaikilta alakoulun alkuvaiheissa olevilta. Ymmärtäminenhän ta- 
vallisesti edeltää (hallittuja) tuottamistaitoja, vaikka ilmeisesti juuri pro- 
nominisyntaksissa ja perspektivoinnissa järjestys voi olla toinenkin (ks. 
Hendriks 2014). 

Tuottamista on tutkittu testein ja kuvasarjakielennöksin, mutta erityi- 
sesti online-tuottamisesta on vähän tutkimusta (Serratrice & Allen 2015). 
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Useimmiten tutkimuksissa on kyse suullisesta kerronnasta tai tuotta- 
mistehtävistä, ei luovasta kirjoittamisesta. Serratricen ja De Catin (2020) 
mukaan aikuisilla on taipumus käyttää pronomineja eniten subjektiase- 
massa ja lauseen alussa sekä myös topiikkina. Aikuiset myös käyttävät 
informatiivisempia ilmauksia, kuten erisnimiä ja indefiniittisiä ilmauk- 
sia, jos referentti viittaa uuteen tietoon tai jos konteksti voisi jäädä epä- 
selväksi. Jo esikouluikäisillä lapsilla on vastaavia taitoja mutta ongel- 
mia lähinnä vastaanottajan näkökulman huomioimisessa. Yksilöllisen 
vaihtelun määrä on kuitenkin suuri. Serratricen ja Allenin 5-7-vuotiaille 
teettämässä referentiaalisen kommunikaation tuottotehtävässä variaa- 
tion mahdollisina taustavaikuttajina tutkittiin kognitiivisen kontrollin 
taitoja, verbaalista työmuistia, kielenhallintaa, kielelle altistumista ja sen 
käytön määrää sekä niin sanottuja sosioekonomisia muuttujia (esimer- 
kiksi vanhempien koulutusta). Tuloksien mukaan merkittäviä vaikutta- 
via tekijöitä sopivan referentiaalisen ilmauksen valintaan ovat erityisesti 
kognitiivinen kontrolli (kuten kyky miettiä valintaa riittävästi), verbaali- 
nen työmuisti ja kielenhallinta: ne selittävät yksiköllistä variaatiota hy- 
vin. Näin on todennäköisesti myös Unelmakirjoitelmien kontekstissa, 
vaikka koehenkilöitä ei ole erikseen näiden muuttujien osalta testattu. 
Mäkinen ja muut (2014) tutkivat kissa-kuvasarjan avulla suullisen 
kerronnan kehittymistä 4-8-vuotiailla suomalaislapsilla. He mittasivat 
kehittymistä tavanomaisin mittarein. Mukana oli kokonaissanamäärä, 
virkemäisen yksikön sanamäärä ja rakenteellinen kompleksisuus, si- 
sällön yksiköiden määrä sekä kyky tuottaa referentiaalista koheesiota 
(referentiaaliset viittaukset). Koehenkilöjoukkoon kuului yli 170 lasta. 
Tulosten mukaan tekstin tuottamisen kehitys näkyi kautta linjan eri 
muuttujissa, mutta parhaiten kertomuksen kehittymistä erottelevina te- 
kijöinä toimivat referentiaaliset ilmaukset. Niiden avulla saatiin näkyviin 
merkitsevä ero alle kouluikäisten ja kouluikäisten lasten välillä. 7-8-vuo- 
tiailla referentiaalinen täsmällisyys nousi jopa yli 80 prosentin, tosin ei 
aivan kaikilla. Samanlaisia tuloksia on saatu muistakin kielistä kuten 
kantonin kiinasta, espanjasta ja englannista. Mäkinen ja muut (2014, 
37) arvelevat, että koska referentiaaliset viittaukset ovat vaativia tuottaa, 
ne täydellistyvät vasta siinä vaiheessa, kun kertomusrakenne hallitaan. 
Kahdeksanvuotiailla esimerkiksi tekstissä taaksepäin viittaavien anafora- 
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suhteiden hallinta ei vielä ole aikuistasolla. Mäkinen ja muut katsovat 
myös, että kehitystrendi sekä täsmällisten viittaussuhteiden että sisällön 
yksiköiden määrien lisääntymisen taustalla on paralleelinen. 

Nuorimmillakin alakouluikäisillä on siis jo melko hyvät edellytykset 
ymmärtää referentiaalisia ilmauksia, ja he pystyvät niitä myös tuotta- 
maan etenkin, jos tuottoa tukee tehtävän rakenne ja jos tuottamista ei 
häiritse muu liian vaativa prosessointi. Tosin lukijan tietoinen huomioi- 
minen ja kielellisen ilmaisun keinot opitaan myöhään (Tomasello 2003; 
Hickmann 2004) ja aikuistason semanttis-pragmaattinen hallinta alkaa 
kehittyä vasta noin kymmenvuotiailla (Hickmann 2004, 285; Berman 
2007). Onnistumiseen vaikuttaa kielenhallinnan taso, kyky keskittyä 
tehtävään, hyvä toiminnanohjaus ja kyky ottaa vastaanottaja huomioon. 
Luova kirjoittaminen luo haastavamman kontekstin kuin ohjeistettu ja 
rakenteellinen tehtäväkertominen. Lisäksi motoriset valmiudet, muistin 
toiminnat sekä tekstityyppien ja tekstilajien tuntemus vaikuttavat suo- 
riutumiseen. On odotuksenmukaista, että suurin osa toisluokkalaisista 
ei vielä täysin onnistu referentiaalisen koherenssin luomisessa vapaassa 
tuottotehtävässä ja että kuudesluokkalaisilla tavoite olisi jo saavutettavis- 
sa, jos tekstiä ylipäätään syntyisi. Tarkastelu keskittyy tässä yhteydessä 
määräisten ilmausten tuottoon kirjoitetussa kielessä. Määräisyyden tar- 
kastelun kehittymistä tutkitaan suhteessa kertovan tekstin kehittymi- 
seen. 


KERTOMUS JA KERTOVA TEKSTI 

Tekstilajeja on tyypillisesti lähestytty sosiaalisen toiminnan näkökulmas- 
ta: samaan tekstilajiin kuuluvilla teksteillä on vuorovaikutustapahtuman 
näkökulmasta samankaltaiset tavoitteet ja rakenne (Virtanen 2010; 
Heikkinen & Voutilainen 2012). Tekstilajit eivät kuitenkaan ole tarkka- 
rajaisia, vaan ne voivat kerrostua ja limittyä monin tavoin (Shore & 
Mäntynen 2006, 11). Vaikka kertomus tekstilajinomaisena käsitteenä on 
laajalti käytössä eri kielissä ja kulttuureissa, se voi itse asiassa todentua 
hyvin monenlaisina teksteinä. Mikäli kertomusta tarkastellaan laajem- 
min tekstilajien supertyyppinä tai tekstityyppinä, sen voidaan katsoa pi- 
tävän sisällään lukuisia toisilleen läheisiä tekstilajin kaltaisia alatyyppejä, 
kuten jannityskertomus, satu, tieteiskertomus, vitsi, juoru tai tunnustus. 
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Kertomus ei siis ole tekstilaji samassa mielessä kuin vaikkapa päiväkirja 
tai raportti, vaan se toimii ennen kaikkea yläkategoriana, joka erottelee 
toisistaan kertovat ja ei-kertovat tekstit tai diskurssit. Lisäksi kertova 
teksti tekstityyppinä tarjoaa keinon tarkastella eri tekstilajia edustavien 
tekstien sisäistä rakentumista. (Tekstityypeistä ja -lajeista tarkemmin ks. 
Bamberg (toim.) 1997; Virtanen 2010; Heikkinen & Voutilainen 2012.) 

Tekstityyppejä esitetään yleensä rajallinen määrä (ks. Werlich 1974). 
Prototyyppisenä ja muista tyypeistä erottuvana tekstityyppinä on pidetty 
juuri kertovaa tekstiä (narrative). Kertova tekstityyppi kuvaa ja luo mieli- 
kuvia todellisista ja kuvitelluista maailmoista. Kertovien tekstien tehtä- 
vä on selkeästi herättää mielikuvia, ei niinkään saada aikaan toimintaa 
(Virtanen 2010, 54-58, 62). Kertova tekstityyppi siis nimensä mukaisesti 
kertoo toiminnasta ja juonen etenemisestä, minkä takia se usein raken- 
tuu toimintaa kuvaavista verbeistä ja on melko usein menneessä aika- 
muodossa. Lisäksi kertovassa tekstityypissä on aktiivisia toimijoita, jot- 
ka tekevät jotakin tai joille tapahtuu jotakin (Pietikäinen & Mäntynen 
2009, 101). Teksti- ja diskurssityypit ja tekstilajit kuitenkin risteävät, 
eikä selkeää rajanvetoa voi tehdä. Niinpä kertomuksetkaan eivät ole 
vaihteluttomia tai yhteneviä, vaan niissä voi Virtasen (2010, 55) mukaan 
toteutua monenlaisia strategioita, kuten listaamista ja luettelointia tai 
suostuttelua. Kertovan tekstityypin lisäksi kertomukset sisältävät yleensä 
myös deskriptiivistä tekstityyppiä, sillä niissä paitsi kerrotaan tapahtu- 
mia, myös kuvataan paikkoja ja ihmisiä. Kertomuksessa voi siis olla 
monenlaista kielellistä toimintaa, sillä tapahtumien kuvaaminen vaatii 
monesti myös paikkojen, henkilöiden ja tunnelmien kuvaamista sekä 
tapahtumien merkityksen arvioimista (ks. esimerkiksi Pietikäinen & 
Mäntynen 2009, 100). 

Tekstilajien ja teksti- ja diskurssityyppien rakentuminen on opittava 
taito, ja toisaalta niitä voidaan käyttää myös luovasti. Pietikäisen ja Män- 
tysen (2009, 104-109) mukaan narratiivit ovatkin sekä kulttuurisesti ja 
historiallisesti kiteytyneitä tapoja kertoa tapahtuneesta että ainutlaatui- 
sia, yksilön omia tapoja merkityksellistää kokemuksia ja tuntemuksia. 
Kertomukset siis ilmaisevat kertojan yksilöllisiä kokemuksia, mutta sa- 
malla ne hyödyntävät kulttuurisia ja yhteisöllisiä kertomusvarantoja ja 
kertomuksellisia resursseja. Niiden kulttuurinen puoli näkyy etenkin 
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siinä, että ne ovat ymmärrettävissä vain, jos vastaanottaja jakaa saman 
käsityksen esimerkiksi ajasta. Narratiivisuuteen, kuten muuhunkin so- 
siaaliseen ja kielelliseen toimintaan, kasvetaan. 

Muihin tekstityyppeihin verrattuna kertovilla teksteillä on kuitenkin 
kaksi vahvaa ominaispiirrettä: kertovissa teksteissä tapahtumien aikajä- 
sennys (usein myös kausaalisuuden ilmaisu) ja osallistujien kuvaaminen 
ovat keskeisiä strategioita (Virtanen 2010, 54-56). Kertomukselle on siis 
tyypillistä, että tapahtumasarja noudattaa ajallisesti loogista rakennetta, 
joka voi kaunokirjallisissa tuotoksissa olla varsin monimutkainenkin 
kokonaisuus. Ajallinen loogisuus pohjautuu kuitenkin ajatukseen toi- 
siaan seuraavista tapahtumista sekä niiden syistä että seurauksista. On- 
nistunut kertomus on siis juonellisesti eheä ja etenee loogisesti, mikä 
näkyy esimerkiksi ajallisena ja toiminnallisena yhtenäisyytenä (Givön 
1983; 2017; Hickmann 2004; Pietikäinen & Mäntynen 2009). Lisäksi 
kokonaisuus on tekstuaalisesti yhdenmukainen. Analysoimme Unelma- 
kirjoitelmien kertomusrakennetta tekstityyppiluokituksen mukaan, joka 
ottaa huomioon kehittyvän kirjoittamisen ja johon määräisten ilmausten 
tyypit ja esiintymämäärät voi suhteuttaa. 

Matilaisen (1989) mukaan kertojataival alkaa alakoulun alussa tyypil- 
lisesti yksittäislauseesta tai -lauseista koostuvana tekstinä, jossa ajallinen 
ja paikallinen tausta on usein ilmaisematta, tapahtumia ei ole liitetty 
tapahtumien ketjuun ja ennen kaikkea tekstin yhteen liittävä toistei- 
suus puuttuu. Toisteisuus erityisesti kertovassa tekstissä syntyy uuden 
tarkoitteen esittelystä ja tähän samaan tarkoitteeseen viittaamisesta jat- 
kossa niin kauan, että päädytään tietyn tapahtumasarjan loppuun. Mati- 
laisen mukaan nuorimmat noudattavat aluksi niin sanottua atomistista 
hahmottamisstrategiaa, joka tuottaa yksittäisiä havaintoja jostain tee- 
masta tai useammista teemoista. Seuraavassa vaiheessa tekstiä tuotetaan 
eräänlaisen serialistisen hahmottamisstrategian mukaan, joka tuottaa 
tapahtumaketjuja usein ajallisessa järjestyksessä. Vasta holistinen tai 
analyyttinen strategia tuottaa Matilaisen mukaan tekstejä, joissa ker- 
ronta kohdistetaan lukijalle halutussa tärkeysjärjestyksessä oleellista 
painottaen. Teksteinä ensimmäisessä vaiheessa tuotetaan listoja, toi- 
sessa skriptejä ja kolmannessa kertovia tekstejä (ks. Pajunen 2012), jos 
kertomus on tavoiteltu tekstityyppi. Listat ovat Bambergin tekstikohe- 
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renssiasteikkoa soveltaen tekstittömiä tai epäymmärrettäviä, skriptit ovat 
todennäköisimmin osittain tai epätäydellisesti koherentteja ja vasta ker- 
tovat tekstit pyrkivät olemaan koherentteja. 


Määräisyyden ilmaiseminen kehittyvässä kertovassa 
tekstissä 


Tarkastelemme määräisyyden ilmaisun kehittymistä alakouluikäisten 
kirjoitelmissa suhteessa kertomuksena eriasteisesti onnistuneisiin teks- 
teihin. Määrittelemme ensin ne ilmaisukeinot, joita lapsilla on käytet- 
tävissään, ja sitten käsittelemme niiden ilmenemistä Unelmakirjoitel- 
missa. 


MÄÄRÄISYYDEN LAJIT JA TEKSTIEN TYYPPILUOKITUS 

Määräisyyden ilmaisemisen tarkastelussa lähtökohdaksi voidaan ottaa 
esimerkiksi kielten luokittelu määräisen artikkelin perusteella, kuten 
Dryer (2013) tekee jakaessaan maailman kielet viiteen ryhmään sen 
perusteella, onko kielissä määräistä ja/tai epämääräistä artikkelia vai 
ei ja missä muodossa ilmaisu milloinkin on. Määräisellä artikkelilla 
erotetaan määräiset ilmaukset epämääräisistä, joilla saattaa olla omat 
merkintäkeinonsa (Larjavaara 2007, 294). Suomen kieli kuuluu Dryerin 
(2013) jaottelun viidenteen ryhmään, jonka muodostavat kielet, joissa ei 
ole määräistä eikä epämääräistä artikkelia. Suomen tapaisessa artikke- 
littomassa kielessä on useampia muita keinoja tehdä syntaksissa eroa 
tutun ja uuden informaation — määräisen ja epämääräisen — välillä. Näi- 
tä ovat muun muassa sijanvalinta, lauserakenteen tasolla tehdyt valinnat 
tai leksikaaliset keinot. Uusi informaatio tuodaan tekstiin joko esitte- 
lyrakenteella (e-subjekti ja käänteinen sanajärjestys) tai jonkinlaisilla 
tarkenteilla (eräs, muuan, joku, yksi). Tuttu tarkoite osoitetaan uudelleen 
maininnalla ja tähdentämällä sitä mahdollisesti määräisillä tarkenteilla 
(tämä/se X) tai esimerkiksi anaforisilla pronomineilla (hän, se). Pelkis- 
täen uusi informaatio ilmaistaan lyhyemmin — tai esimerkiksi epämää- 
räisellä artikkelilla, jos kieli sen tuntee — mutta tuttua informaatiota 
voidaan merkitä monella tavalla myös siten, että puheena olevan tar- 
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koitteen (tai siihen viittaavan substantiivin) sisältävä rakenne komplek- 
sistuu. 

Suomen kielessä tarkoitteet voivat tekstissä olla merkityksensä puo- 
lesta määräisiä tai epämääräisiä (Penttilä 1963, 532). Lisäksi ne voivat 
olla geneerisiä eli yleisiä tai puolidefiniittisiä eli puolimääräisiä. Penttilä 
(mp.) kuitenkin toteaa, ettei suomen kielessä ole mitään mainittavia 
muotokeinoja näiden eri merkityslajien — määräisen, epämääräisen, ge- 
neerisen ja puolimääräisen — ilmaisemiseksi, vaan tarkoitteen määräi- 
syyslaji jätetään yleensä erikseen ilmaisematta. Muotokeinojen puutteen 
syynä lienee se, että suomen kaltaisessa ei-artikkelikielessä puhuja ja 
kirjoittaja saavat itse päättää, esittävätkö he tekstinsä tarkoitteet mer- 
kitsemättöminä vai määräisiksi merkittyinä (Juvonen 2000, 29). Koska 
tarkoitteiden määräiseksi merkitseminen on vapaaehtoista, määräisyy- 
den keinovalikoima on suomen kielessä melko laaja ja vakiintumaton. 

Larjavaara (2007, 300) kuvaa suomen kaltaisten artikkelittomien kiel- 
ten definiittisyyttä kuulijanäkökulmaiseksi spesifiksi representaatioksi. 
Hänen mukaansa (2007, 301) suomen tyyppisen kielen yleisessä defi- 
niittisyydessä on kyse universaalista kommunikatiivisesta merkityksestä, 
joka on mukana kaikissa kielissä mutta jolla on erilaisia ilmaisimia eri 
kielissä. Yleisimpiä ilmaisimia kaikissa kielissä ovat demonstratiivit, ja 
niiden määräiseksi tunnistaminen voi perustua muun muassa konteks- 
tiin ja sanajärjestykseen: lauseenalkuinen sana tulkitaan yleensä määräi- 
seksi ja lauseenloppuinen epämääräiseksi. Toisin sanoen tunnistaminen 
noudattaa saavutettavuushierarkiaa (Arnold 2008). Semanttinen defi- 
niittisyys on Larjavaaran (2007, 301) mukaan suomen kielessä relatiivis- 
ta: kaikki kielen viittaavat ilmaukset eivät ole joko definiittisiä tai indefi- 
niittisiä. Tekstin tuottaja ilmaisee ennen kaikkea kokonaisuuksia, jolloin 
ei ole olennaista, että vastaanottaja tunnistaa jokaisen kokonaisuuden 
osan. Ymmärtämistutkimus ei tosin täysin tue Larjavaaran näkemystä, 
koska lukija pyrkii ratkaisemaan epäselvätkin viittaussuhteet lukiessaan 
(vrt. esimerkiksi Glucksberg ja muut 1975; Beal & Belgrad 1990), mikäli 
lukee ymmärtääkseen. Lapset pystyvät tähän jo noin kahdeksanvuotiaasta. 

Rajaamme tässä yhteydessä tarkastelun sellaisiin määräisiin ilmauk- 
siin, joissa määräinen tarkoite kielennetään substantiivilla. Jos substan- 
tiivilla on tarkenne, kokonaisuutta voidaan tarkastella substantiivilau- 
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sekkeena. Substantiivilausekkeen alatyypit eli ne, joissa substantiivin 
edustajana on pronomini tai numeraali (vrt. esimerkiksi Hakulinen, 
Vilkuna, Korhonen, Koivisto, Heinonen, Alho 2004, 431), jäävät aineis- 
ton ulkopuolelle. Aineistoon kuuluu sekä yleis- että erisnimiä, ovathan 
tekstien henkilöhahmoihin viittaavat nimitykset olennainen osa kerto- 
musta. Lisäksi jotta se-tarkenteen oletettua artikkelistumista voidaan 
mitata suhteessa mahdollisten ilmauksien kokonaismääriin, aineiston 
kaikki määräiset ilmaukset ovat sellaisia, jotka periaatteessa voivat saada 
pronominitarkenteen. Aineiston ulkopuolelle jäävät siis ne määräiset 
ilmaukset, jotka ilmaisevat temporaalisia eli ajallisia tai spatiaalisia eli 
paikkaan liittyviä merkityksiä ja joita tarkennetaan proadverbeillä. Lisäk- 
si tutkimusaineiston ulkopuolelle jäävät luonnostaan määräiset per- 
soonapronominit (ks. Hakulinen ja muut 2004, 1352), pelkkien prono- 
minien muodostamat lausekkeet, adjektiiviedussanaiset lausekkeet sekä 
ellipsin takia edussanattomat lausekkeet. — Määräisten ilmauksien tar- 
kastelu rajautuu noin 24 000 tekstisanan aineistoon, joka on poimittu 
toisen, neljännen ja kuudennen luokka-asteen Unelma-aineistosta. 
Se- tai ne-tarkenteella merkittyjä ilmauksia tarkastellaan laajemmasta 
aineistosta eli 2.-6. luokan teksteistä (n. 40 000 tekstisanaa), jotta esi- 
merkkejä löytyy riittävä määrä. 

Määräinen ilmaus on määräinen, kun sen tarkoite on tilannekonteks- 
tissaan sillä tavoin ainoa, että tekstin tuottaja voi olettaa vastaanottajan 
tietävän, mistä tarkoitteesta on kyse. Tarkoitteen uudelleenmaininta on 
määräisyyden tyyppitapaus (Hakulinen ja muut 2004, 1350). Näin ollen 
tekstissä jo aikaisemmin mainittuun, tekstistä tai kontekstista pääteltyyn 
tai muuten ilmeiseen tarkoitteeseen viittaavat substantiivilausekkeet 
ovat määräisiä (ks. Prince 1981; 1992; Vilkuna 2000; Hakulinen ja 
muut 2004). Määräisiä ovat paitsi kontekstista päätellyt myös aktivoidut 
ilmaukset, jotka ovat tyypillisesti suhteessa vastaanottajaan ja liittyvät 
siihen kehykseen, jonka konteksti luo hänen mieleensä (ks. Prince 1981; 
Vilkuna 1992). Kehittyvässä kirjoituksessa myös ensimaininnat voivat 
olla määräisiä, etenkin jos niiden tarkoite on tavalla tai toisella ankkuroi- 
tu kontekstiin (vrt. taulukko 22, Prince 1981). Määräisyys suhteutuu 
myös implikatiiviseen tunnettuus- ja saavutettavuushierarkiaan (Gundel 
ja muut 1993), joten joidenkin tarkoitteiden — erityisesti uudelleenmai- 
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nintojen — määräisyys on moninkertaista. Kun analysoinnissa on kui- 
tenkin kyse kehittyvästä kielestä, on selvä, että esimerkit ovat välillä 
tulkinnanvaraisia. Uudelleenmainintojen vastakohtana toimivat ensi- 
maininnat saavat epämääräisen tulkinnan, mikäli tarkoite ei ole tuttuu- 
deltaan ilmeinen tai lauseke ei sisällä määräisyyttä ilmaisevia määrittei- 
tä, joita ovat muun muassa pronominitarkenteet, genetiivimääritteet ja 
possessiivisuffiksit (Hakulinen ja muut 2004, 1350). 

Määräisyyden lajit muodostavat tässä tutkimuksessa viisi ryhmää (ks. 
taulukko 23), jotka toimivat aineiston käsittelyn perustana. Ensimainin- 
naltaan määräinen ilmaus voi kuulua taulukon 23 ryhmiin 2-5, eli mää- 
räisyys voi perustua tarkenteeseen, tuttuun tarkoitteeseen, universaali- 
pronominiin tai kvantitatiivisuuteen. Uudelleenmainintoihin on puo- 
lestaan viitattu jo aiemmin tekstissä tai tarkoitteet ovat kontekstinsa 
perusteella niin ilmeiset, että ilmauksen voi katsoa olevan lukijalle tuttu 
eli kontekstissaan määräinen. 


Taulukko 23. Määräisyyden lajit. 


Ryhmän nimi Sisältö 


1. Uudelleenmaininta Aikaisemmin mainittu 
Tekstistä tai kontekstista päätelty 
Muuten ilmeinen 


2. Tarkenteet Demonstratiivipronomini 
Genetiivimäärite 
Possessiivisuffiksi 


3. Tutut tarkoitteet Frisnimet 
Tutut henkilöt ja paikat 
Perheenjäsenet 
Tarkoitteet, joita on olemassa vain yksi kerrallaan 


4. Universaalipronominit — Kaikki-merkityksiset pronominit 


5. Kvantitatiivisuus Nominatiivi- tai genetiivimuotoinen määrite 


Määräisten ilmauksien lajit suhteutetaan niin sanottuihin kertomustyyp- 
peihin, jotka kuvaavat kehittyvää kirjoittamista kertovaan tekstiin johdat- 
televasta aiheesta Unelmieni päivä (aineistoa esitellään tarkemmin kir- 
jan johdantoluvussa). Oppilaskohtaisten tasoerojen ja luokka-asteiden 
välisten kehityserojen takia aineisto sisältää hyvin heterogeenisen teksti- 
joukon (vrt. Matilainen 1989). Osa teksteistä on helposti luokiteltavissa 
kertomuksiksi, mutta osa muistuttaa enemmän luetteloa tai kuvausta 
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kuin kertomusta (vrt. Pajunen 2012). Tekstien ominaisuuksiin perustuva 
luokittelu muodostaa jatkumon, jonka toisessa päässä on kertomusmai- 
siksi luokiteltavat tekstit ja toisessa päässä luetteloiksi laskettavat teks- 
tit (ks. taulukko 24). Näiden ääripäiden välillä on kolme tekstiryhmää: 
luettelomaiset kertomukset eli skriptit, keskeneräiset kertomukset ja 
lyhyempään hetkeen keskittyvät kuvaukset. Luokittelu poikkeaa Pajusen 
(2012), Matilaisen (1989) ja Vesalan (2012) tekemistä holistisista arvioin- 
neista jonkin verran, koska tavoitteena on saada määräisten ilmauksien 
käytön kehittyminen mahdollisimman selvästi näkyviin. 


Taulukko 24. Tekstien luokittelu sisällön ja rakenteen perusteella määriteltäviin tekstityyp- 
peihin. 


Tekstin tyyppi Piirreluettelo 

Kertomusmainen teksti Tekstistä erottuu selkeä juoni, jonka etenemistä kertoja 
kuvaa 
Kertoja perustelee tapahtumien väliset syy- ja seuraus- 
suhteet 


Sisällön kannalta olennaiset asiat pysyvät mukana koko 
kertomuksen ajan 


Luettelomainen teksti Tapahtumien väliin jää selittämättömiä aukkoja 
Kerronta etenee pintapuolisesti ja kuvauksen määrä on 
vähäistä 
Tapahtumasta toiseen siirrytään usein, minkä takia teksti 
vaikuttaa juonirungolta 


Keskeneräinen kertomus Teksti alkaa kertomusmaisesti mutta loppuu yllättäen 


Kuvaus Teksti keskittyy kuvaamaan lyhyttä hetkeä 
Teksti ei juurikaan sisällä tapahtumia 


Luettelo Teksti listaa tapahtumat peräkkäin 
Kokonaisuus voi muodostua yhden verbin ympärille 
Siirtymät ja tapahtumien kuvaus jäävät huomiotta 


Kertomusmaisten tekstien ryhmään kuuluvat kirjoitelmat, joista erottuu 
selkeä juoni, jonka etenemistä tekstin kertoja kuvaa. Teksti muodostaa 
koherentin kokonaisuuden, jossa juonen kannalta olennaiset asiat pysy- 
vät mukana koko kertomuksen ajan. Kertomusmaisen tekstin kertoja 
perustelee tapahtumien väliset syy- ja seuraussuhteet sekä sitoo kerto- 
muksensa aikaan ja paikkaan. Kertomus on siis rakenteeltaan johdon- 
mukainen ja tekstuaalisesti yhdenmukainen, ja se herättää mielikuvia 
luomistaan todellisista tai kuvitelluista maailmoista. Koulukorpuksen 
teksteissä nämä mielikuvat liittyvät unelmien päivään ja sen sisältöön. 
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Luettelomaisten kertomusten ryhmä sijoittuu tekstityyppijatkumolla 
melko lähelle kertomusmaisten tekstien ääripäätä. Ryhmän tekstit muis- 
tuttavat kertomuksia mutta ovat niin pelkistettyjä, että teksti muodostaa 
pikemminkin juonirungon kuin varsinaisen kertomuksen. Yksi luettelo- 
maisen kertomuksen tunnuspiirre on peräkkäisyyttä ilmaisevan tem- 
poraalisen sitten-adverbin käyttö virkkeen alussa. Tapahtumasta toiseen 
siirrytään nopeasti ja tapahtumien välille saattaa jäädä pitkiäkin selittämät- 
tömiä aukkoja. Nämä tyhjät kohdat eivät kuitenkaan vaikuta harkituilta 
tyylikeinoilta, minkä takia tekstiin syntyy luettelomaisuuden vaikutelma. 
Luettelomaisen kertomuksen kerronta pysyttelee hyvin yleisellä tasolla 
ja kuvauksen määrä on varsin vähäistä. Osallistujien kuvaaminen jää 
vähemmälle, mutta tekstin tapahtumat liittyvät toisiinsa, mikä erottaa 
luettelomaisen kertomuksen puhtaasti luetteloiksi nimetyistä teksteistä. 

Jatkumon seuraavan ryhmän muodostavat keskeneräiset kertomukset. 
Ne alkavat varsin kertomusmaisesti mutta loppuvat yllättäen. Kertoja voi 
kuvailla tapahtumia hyvinkin tarkasti tekstin alkupuolella, mutta kerto- 
mus ei saavuta loppuratkaisuaan tekstin aikana. Kirjoittaja ei siis ole 
saanut tekstiään valmiiksi aikarajojen puitteissa tai on väsynyt kirjoitta- 
miseen ja lopettanut tekstin kesken. Keskeneräisten kertomusten tär- 
kein piirre onkin juuri tarinan yllättävä katkeaminen: teksti etenee loogi- 
sesti, kirjoittaja osoittaa tapahtumien aikajäsennyksen ja kuvaa osallistu- 
jia mutta ei vie juonta loppuun asti. Lisäksi aineistossa on tekstejä, jotka 
alkavat varsin kertomusmaisesti mutta joissa kerronta muuttuu alun 
jälkeen luettelomaisempaan suuntaan. Tällaiset tekstit eivät kuitenkaan 
kuulu keskeneräisten kertomusten ryhmään, sillä niissä tapahtumat 
kerrotaan loppuun saakka. Nämä tekstit on luokiteltu luettelomaisiin 
kertomuksiin. 

Neljännen ryhmän muodostavat kuvauksiksi luokiteltavat tekstit. Ku- 
vaukset keskittyvät päivää lyhyempään hetkeen ja kuvaavat yksittäisen 
asian tai tapahtuman melko tarkasti. Kuvauksiksi luokiteltavissa teks- 
teissä ei ole juonirunkoa eikä teksti pidä sisällään runsasta tapahtumien 
joukkoa. Osallistujia kuvataan mutta esimerkiksi tapahtumien aika- 
jäsennys puuttuu. Ryhmään kuuluvat myös aineiston lyhimmät tekstit, 
jotka eivät lyhyytensä ja tapahtumaköyhyytensä perusteella kuulu mihin- 
kään muuhun jatkumon tekstiryhmään. 
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Kertomusmaisten tekstien vastakohtana tekstityyppijatkumolla on 
luetteloiksi nimetyt tekstit. Niissä unelmien päivän tapahtumat on listat- 
tu peräjälkeen eikä yksittäistä tapahtumaa kuvata mainintaa tarkemmin. 
Luettelo voi koostua yksittäisistä sanoista, lauseista tai parin virkkeen 
kokonaisuuksista. Usein luetteloksi luokiteltava teksti rakentuu yhden 
verbin, kuten haluamista tai saamista ilmaisevan, ympärille. Teksti ei si- 
sällä perusteltuja syy- ja seuraussuhteita eikä siirtymiä tai itse tekemistä 
kuvailla tarkemmin. Tekstin sisältämät tapahtumat eivät välttämättä liity 
toisiinsa, ja niiden ajallinen etäisyys toisistaan voi olla hyvinkin pitkä. 
Juuri tapahtumien kausaalinen ja ajallinen irrallisuus erottaa luettelot 
luettelomaisista kertomuksista. 

Kun aineiston tekstejä on jaettu tekstin tyyppijatkumon ryhmiin, ei 
ole juurikaan huomioitu sitä, pysyykö oppilaan kirjoittama teksti anne- 
tussa aiheessa. Koska tutkimuksen kohteena ovat määräisten ilmauksien 
yhteydet tekstin luokitukseen, aiheessa pysyminen ei ole olennainen 
luokittelukriteeri. Huomio keskitetään siis tekstin sisällön ja rakenteen 
muodostamaan kokonaisuuteen ja siihen, millaisia yhteyksiä määräis- 
ten ilmauksien tekstikohtaisella esiintymämäärällä on tähän kokonai- 
suuteen (vrt. Labov & Waletzky 1967). 


MÄÄRÄISET ILMAUKSET UNELMAKIRJOITELMISSA 

Määräisiä ilmauksia eli lausekkeita, joiden pääsanana on tavalla tai toi- 
sella tuttuun tarkoitteeseen viittaava substantiivi, on aineistossa parisen 
tuhatta, määrällisesti lähes yhtä paljon aineiston joka luokka-asteella, 
mutta kirjoittajakohtainen ja suhteellinen jakauma on vino (ks. taulukko 
25). Hieman useampi kuin joka kymmenes (14,8 %) teksti sisältää vain 
epämääräisiä ja geneerisiä ilmauksia ja luokka-asteittain tarkasteltuna 
tällaisten tekstien osuus on odotuksenmukaisesti suurin toisen luokan 
aineistossa (22,7 %). Neljännellä ja kuudennella määräisiä ilmauksia 
jätetään käyttämättä enää alle kymmenesosassa tekstejä. Sukupuolittain 
tarkasteltuna vain epämääräisten ja geneeristen ilmauksien käyttämi- 
nen näyttäisi olevan leimallisempaa pojille, sillä 73,5 prosenttia tällaisten 
tekstien kirjoittajista on poikia. Nämä tekstit ovat useimmiten luettelo- 
maisia kokonaisuuksia, jotka rakentuvat haluamista tai saamista tarkoit- 
tavien verbien ympärille (ks. esimerkki 1). Myös melko yleisellä tasolla 
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Taulukko 25. Määräiset ilmaukset ikäluokittain Unelmakirjoitelmissa. 


Unelmakirjoitelmien otos Toinen Neljäs Kuudes 
Tekstejä otoksessa n = 163 n = 96 n =71 
Määräisiä ilmauksia n = 643 n = 655 n = 678 
Tekstit, joissa on määräisiä ilmauksia 77,3 % 92,7 % 92,9 % 
Tekstit, joissa ei ole määräisiä ilmauksia 22,7 % 7,3 % 7,0 % 
Määräisiä ilmauksia keskimäärin / teksti 5,1 kpl 7,4 kpl 10,3 kpl 


pysyttelevät kuvaukset unelmien päivän ohjelmasta sisältävät vain epä- 
määräisiä ja geneerisiä ilmauksia (esimerkki 2). Vaikka geneeriset il- 
maukset toistuvat tekstissä, tarkoitteen uudelleenmainintoja ei lasketa 
määräisiksi, koska niillä ei viitata tiettyyn tarkoitteeseen vaan ylipäätään 
tarkoitteiden luokkaan. 


1) Haluaisin mönkiän ja paystation2. Haluaisin hiihtää paljon ja 
lasketella paljon. Haluaisin ajaa paljon rallia ja jokkista. Haluaisin 
rahaa paljon ja ostaisin lemikiä. Haluaisin autoja. Haluaisin isoon 
huvilan ja ruokaa paljon ja syödä paljon ja lumilaudan ja laskettelu- 
sukset ja oman metsän ja traktorin. (2M189) 

2) unelmieni päivä on olla viistoista-vuotias koska saan ajaa mopolla 
kouluun ja kotiin. Se on hauskaa kun saa ajaa mopolla ees taas. kivaa 
on myös vapaa ajalla ajella mopolla joka paikassa. Mopolla pääsee no- 
pempaa, kuin pyörällä tai kävellen esim. koulusta kotiin. Voisin ottaa 
mopoauton, koska sillä pystyy harjoitteleen autolla ajamista ja pystyis 
tuunaamaan sitä. Mopoautolla olisi kivaa talvella johonkin mutkaan 
heittää auton takaperää ja laittaa kunnon poppis-stereot ja isot subba- 
rit taakse. Niin sois kunnolla musiikki autossa. Loppu (6M87) 


Kirjoittajakohtaisesti tarkasteltuna määräisten ilmauksien käyttäminen 
lisääntyy selvästi iän myötä. Kun toisluokkalaisten ylipäätään määräi- 
siä ilmauksia sisältävissä kirjoitelmissa niitä on keskimäärin 5,1, luku 
on neljäsluokkaisilla 7,4 ja kuudesluokkalaisilla jo 10,3 (ks. taulukko 
25). Tiheys siis kasvaa kehityksellisesti, mikä on odotuksenmukaista. 


49 Koulukorpuksen kirjoittajat on identifioitu seuraavasti: kaksi ensimmäistä merkkiä paljastavat luokka- 
asteen ja sukupuolen ja loput tekstin tunnisteen itse korpuksessa. 
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Mäkisen ja muiden (2014) arvelun mukaan referentiaalisten ilmausten 
onnistunut tuottaminen edellyttää kertomusrakenteen hallintaa. Kun 
määräisten ilmausten määriä vertaa Pajusen (2012) antamiin lukuihin 
samojen kirjoitelmien — joskin hieman laajemman joukon — kertomus- 
rakenteen jonkinasteisesta noudattamisesta ja kun ottaa huomioon, että 
laskelmissamme eivät ole aivan kaikki referentiaaliset ilmaukset, näyttää 
siltä, että arvelu on tyttöjen osalta oikeansuuntainen: toisluokkalaisten 
tyttöjen kirjoitelmista kertomusrakennetta noudattaa 6o prosenttia, nel- 
jäs- ja kuudesluokkalaisten noin 80 prosenttia. Poikien osalta yhteys ei 
näy (30 %, 50 % ja 60 %), mikä voi johtua esimerkiksi siitä, että pojil- 
le oman tarinan kirjoittaminen on haasteellisempaa kuin vaikkapa kuva- 
sarjasta kertominen. Määräisten ilmausten keskimääräinen esiinty- 
mistiheys ei muutenkaan kerro koko totuutta niiden käytöstä, sillä kir- 
joittajakohtainen vaihtelu on niin suurta. 

Kirjoitelmien määräiset ilmaukset (n =1976) ovat definiittisiä joko 
uudelleenmaininnan, tarkenteen, tutun tarkoitteen, universaalipronomi- 
nin tai kvantitatiivisuuden perusteella (tarkemmin ks. taulukko 23). Kun 
nämä ilmaukset jaetaan kahteen ryhmään sen perusteella, onko lau- 
seke määräinen jo ensimaininnaltaan vai vasta uudelleenmaininnan 
myötä, huomataan, että kunkin luokka-asteen määräisistä ilmauksista 
noin puolet on ensimainintoja ja puolet uudelleenmainintoja. Jo tämä 
jakauma on paljonpuhuva ottaen huomioon, että uudelleenmaininta on 
kuitenkin eräänlainen määräisyyden prototyyppi. Määräisten ensimai- 
nintojen lähempi tarkastelu osoittaa, että valtaosa jo ensimaininnaltaan 
määräisistä ilmauksista saa definiittisyytensä joko tutun tarkoitteen tai 
tarkenteen myötä. Toisen luokan aineistossa tuttuihin tarkoitteisiin viit- 
taavat ensimaininnat muodostavat yli puolet kaikista määräisistä ensi- 
maininnoista, kun neljännellä luokka-asteella niiden määrä jää alle puo- 
leen ja kuudennella luokka-asteella vajaaseen kahteen viidesosaan (ks. 
taulukko 26). Väheneminen on asteittaista ja toisen ja kuudennen välillä 
ero on jo noin 16 prosenttiyksikköä. Kehityssuunta on päinvastainen tar- 
kenteen perusteella määräisissä ensimaininnoissa, sillä nyt määrä kas- 
vaa (28,2 %, 34,9 % ja 37,9 %). Muutos on jälleen asteittainen, ja toisen 
ja kuudennen välinen ero on kasvanut jo lähes kymmeneen prosentti- 
yksikköön. Ero on selvästi kehityksellinen ja tarkoittaa, että nuorimmat 
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kirjoittajat puhuvat paljon paitsi perheenjäsenistä (äiti, isä) myös ystävis- 
tään (Liisa, Pekka) heitä lukijalle esittelemättä. Vanhemmilla kirjoittajilla 
tällaisiin ilmauksiin sisältyy jokin luonnehdinta (äitini, ystäväni, luokka- 
toverini) myös ensimaininnassa. Kuudesluokkalaisilla on eniten myös 
määräisten ilmauksien pikkutyyppejä, mikä voi kertoa määräisyyden 
ilmaisemisen keinojen monipuolisemmasta hallinnasta. 


Taulukko 26. Määräisten ilmausten ensimainintojen lajit. 


Määräiset ensimaininnat / Ikäluokka % Toinen Neljäs Kuudes 
Tarkenteellinen määräisyys 28,2 34,9 37,9 
Tuttu tarkoite 53.4 49,3 37,2 
Tarkenteellinen tuttu tarkoite 8,2 6,3 8,4 
Universaalipronominin sisältävä 4,9 4,6 5,3 
Kvantitatiivisesti määräinen 3,6 3,6 10,5 
Muu 1,6 1,3 0,7 


Määräisten ensimainintojen tarkastelusta tuttuja kehityssuuntia on ha- 
vaittavissa myös uudelleenmainintojen osuuksissa (ks. taulukko 27), jos- 
kaan kehitys ei ole yhtä lineaarista kuin ensimaininnoissa. Yksinkertaisten 
uudelleenmainintojen määrä kasvaa selvästi iän mukaan, ja toisen ja kuu- 
dennen luokan välinen ero on jo 10 prosenttiyksikköä. Tarkenteellisten 
uudelleenmainintojen prosentuaalinen osuus niin ikään kasvaa, ja toisaal- 
ta tuttuihin tarkoitteisiin viittaavien uudelleenmainintojen osuus piene- 
nee merkittävästi eli noin 20 prosenttiyksikköä. Uudelleenmaininnoissa 
kirjoittajat hyödyntävät pelkän toistamisen (esimerkki 3) lisäksi kehyksen 
aktivaatioon perustuvia määräisiä ilmauksia (esimerkit 4-5) ja voivat 
merkitä tällaiset uudelleenmaininnat myös tarkenteella (esimerkki 6). 


Taulukko 27. Määräisten ilmauksien uudelleenmainintojen lajit. 


Määräiset uudelleenmaininnat / Ikäluokka % Toinen Neljäs Kuudes 
Uudelleenmaininta 41,7 38,6 51,4 
Uudelleenmaininta ja määräinen tarkenne 11,2 39,3 20,4 
Uudelleenmaininta ja tuttu tarkoite 41,4 17,9 22,1 
Yhdistelmätyyppi 3,6 3,4 3,8 
Uudelleenmaininta ja universaalipronomini L5 0,6 0,3 
Uudelleenmaininta ja kvantitatiivisuus 0,6 0,0 0,3 
Muut 0,0 0,3 1,8 
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3) Pusukala tuli ja pussasi minu. Se oli todella hieno. Keräsin sukellus- 
reppuun simpukoit, korallia ja otin vesikamerallani kuvia pusukalasta. 
(4F23) 

4) Ilalla menen saunaan ja sieltä monta kertaa uimaan. Vesi ei ole 
kylmää vaan sopivasti viileää — — Järvi on ihan tyyni. (GF1) 

5) Kotona huudan äitiä ja kysyn häneltä innokkaana risteilystä. Lähtö 
olisi klo 17. (6F4) 

6) Siskoni meni allergiatesteille. Kysyin illalla äitiltä oliko siskoni aller- 
ginen. Olin hirveän iloinen koska hn ei ollut allerginen. Seuraavana 
päivänä olin kaverini kanssa. Äiti soitti minulle ja sanoi että voitaisiin 
ostaa tänään se hamsteri. (4F3) 


Muut määräisen uudelleenmaininnan lajit ovat melko vähämerkityk- 
sisiä. Tämä on odotuksenmukaista, koska määräisyyden ilmaisussa uu- 
delleenmaininta ja tarkenne ovat hierarkian huipulla. Kaikista määräisis- 
tä ilmauksista jo ensimaininnaltaan määräisten määrä siis laskee ja vas- 
taavasti vasta uudelleenmaininnan jälkeen määräisten määrä kasvaa, 
mikä osoittaa, että referentiaalinen koherenssi kasvaa kehityksellisesti. 
On kuitenkin muistettava, että aineistoon ei ole sisällytetty anaforisia 
viittauksia, jotka ovat yksi uudelleenmaininnan perustyyppi. Anaforiset 
pronominit (hän, se) ovat kertovassa tekstissä usein subjektipositiossa 
(ks. esimerkiksi Arnold 2008) ja samasta aineistosta tehdyissä Pajusen 
(2012) laskelmissa deiktisten pronominisubjektien määrä laskee yli 
10 prosenttiyksikköä ja anaforisten määrä taas nousee toisen ja viiden- 
nen luokan välillä yli 10 prosenttiyksikköä, kuudennella vähän vähem- 
män. On huomattava, että deiktisetkin pronominit ovat luontaisesti 
määräisiä mutta tilanneviitteisinä ne ovat kehityksellisesti vähemmän 
merkitseviä. Koherenssin kasvuun viittaa myös Heinosen (2018) tulos, 
jonka mukaan aiheiden määrä laskee Unelmakirjoitelmissa kehitykselli- 
sesti, kun taas sanamäärä kasvaa: samasta aiheesta kerrotaan iän myötä 
aiempaa enemmän. 


MÄÄRÄISTEN ILMAUKSIEN LAJIT JA TEKSTIEN TYYPIT 
Kyky ymmärtää ja tuottaa referentiaalisia ilmauksia kehittyy hitaasti ja 


edellyttää monenlaisia taustatekijöitä, joista semanttis-pragmaattinen 


180 ANNA-KAISA KOUVO, MARI HONKO JA ANNELI PAJUNEN 


https://doi.org/10.21435/skst.1472 


hallinta lienee nykykontekstissa tärkein. Tekstin tuottajan on myös hal- 
littava ne kielen keinot, joilla määräiset ilmaukset merkitään lukijallekin 
ymmärrettäviksi. Referentiaalisten ilmausten on arveltu yhdistyvän niin 
ikään hitaasti kehittyvään taitoon tuottaa tekstilajeittain tyypillisiä raken- 
teita. Analysoimme tässä alajaksossa, miten paljon määräisiä ilmauksia 
on teksteissä toisella, neljännellä ja kuudennella luokalla ja miten nämä 
määrät suhteutuvat Unelmakirjoitelmien tekstityyppiluokitukseen (ks. 
taulukko 24). Näin toivottavasti saadaan arvelua tarkempi vastaus refe- 
rentiaalisen koherenssin ja kertomusrakenteen hallinnan yhteydestä 
(Berman 2007; vrt. Mäkinen ja muut 2014). 

Määräiset ilmaukset on uudelleenluokiteltu esiintymämäärien pe- 
rusteella muutamaan luokkaan, jotta mahdolliset kehityserot saataisiin 
paremmin näkyviin. Luokista oleellisimmat ovat kolme ensimmäistä: 
tekstissä ei ole lainkaan määräisiä ilmauksia tai tekstissä on joko 1-5 
tai 6-10 määräistä ilmausta (taulukko 28). Jos määräisiä ilmauksia ei 
ole lainkaan, tekstissä viitataan pelkästään epämääräisiin tai geneerisiin 
tarkoitteisiin. On myös mahdollista, että teksti etenee minä-subjektin 
varassa. Joka toisessa toisluokkalaisen tekstissä määräisiä ilmauksia on 
1-5, mutta neljäsluokkalaisilla niiden määrä jää näin pieneksi enää alle 
puolessa ja kuudesluokkalaisilla enää joka kolmannessa tekstissä. Ylei- 
syysluokassa 6-10 suhde on jo kääntynyt päinvastaiseksi: kuudesluokka- 
laisten tekstejä on yleisyysluokassa eniten ja toisluokkalaisten vähiten. 
Myös hajonta eri yleisyysluokkiin on kuudesluokkalaisilla suurinta. 


Taulukko 28. Määräisten ilmauksien määrä teksteistä. 


Määräisiä ilmauksia teksteittäin / Ikäluokka % Toinen Neljäs Kuudes 
n = 163 n = 91 n =71 
o 22,7 73 7,0 
15 52,1 45,8 31,0 
6-10 16,6 24,0 28,2 
1115 4,9 13,5 12,7 
16-20 1,8 5,2. 7,0 
21—25 18 2; 7,0 
26-30 0,0 1,0 2,8 
Yli 30 0,0 1,0 4,2 
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Vain yhden määräisen ilmauksen sisältävät tekstit pysyttelevät melko 
yleisellä kertomisen tasolla. Toisluokkalaisten aineistossa tällaiset tekstit 
ovat luettelomaisia (esimerkki 7), kertovat tapahtumista vain suurpiirtei- 
simmät tapahtumalinjat (esimerkki 8, luettelomainen kertomus) tai ovat 
huomattavan lyhyitä. Samankaltaisia piirteitä on myös neljännen ja kuu- 
dennen teksteissä, joissa esiintyy vain yksi määräinen ilmaus. Neljäs- 
luokkalaisilla kyse on luettelevista tapahtumalistoista, päivää lyhyem- 
pään ajanjaksoon keskittyvistä pikku kuvauksista tai luettelomaisista 
kertomuksista (esimerkki 9). Kuudesluokkalaisilla taas yhden määräisen 
ilmauksen tekstit ovat luettelomaisia kertomuksia, kuvauksia tai peräti 
luetteloita. Luettelomaiset kertomukset kertovat vain pääkohdat päivän 
tapahtumista (esimerkki 10). Kuvauksiksi luokiteltavat tekstit taas kes- 
kittyvät jonkin asian havainnollistamiseen, eivätkä päivän tapahtumat 
ehdi alkaa tai niistä kerrotaan hyvin vähän. 


Luettelo: 
7) No mennä helsinkiin ja Olla 2 viikkoa ja mennä lentokoneella afrik- 
kaan ja syödä karkkia ja uida ja pelata pleikkaria. ja leikkia kave- 
reitten kanssa ja lukea Harry Potteria ja mennä särkän niemeen. Ja 
seikkailla afrikassa ja suunnistaa ja ajaa pyörällä. (2M180) 
Luettelomaisia kertomuksia: 
8) Silloin oli kaunis päivä ja aurinko paistoi. Me olimme esbaniassa. 
Siellä oli hieno uima allas. Sieltä meni rengas josta piti sukeltaa pore- 
altaaseen. Kun me mentiin takaisin lentokoneella. Kun me noustiin 
ilmaan niin alkoi tuntua omituiselta. Kun me oltiin perillä oli ihanaa 
tulla siistii kotiin kun ennen lähtöä me siivottiin. (2F44) 
9) Olipa kerran talvinen päivä. Olimme menossa hiihtämään koulun 
kanssa. Silloin kun olimme päässeet Niihamaan, silloin sai olla lämpi- 
mässä ja kioskilla yms. Sellainen oli unelmieni päivä. (4M103) 
10) Olin autiosaarella ja kello oli 19.30. Naisia ja juomaa riitti vaikka 
muille jakaa. Tanssit alkoivat juuri ja kivaa on. Kello 21.00 alkoi limbo 
kisa, jonka voitin ja sain valita yhden tytön ja me pääsimme sviittiin 
yöksi. Se oli mahtavaa, kello 23.15 olimme Maijan (jonka valitsin lim- 
bokisan voitosta) kanssa sviitissämme ja pelasimme monopolia kello 
1.30 asti, sitten menimme nukkumaan. (6M113) 
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Muutaman määräisen ilmauksen sisältävissä teksteissä esiintyvät jo 
kaikki tekstityypit. Ryhmään kuuluvissa toisluokkalaisten teksteissä on 
sekä luettelomaisia, yleisellä tasolla pysytteleviä kirjoituksia (esimerkki 
11) että kertomusmaisempaa tekstiä (esimerkki 12). Luettelomaisten ker- 
tomusten ja kertomusmaisten tekstien määrä on aiempaa suurempi, 
mutta luettelot ja kuvaukset ovat yhä varsin yleisiä. Neljäsluokkalaisilla 
taas suosituimmaksi ryhmäksi nousevat luettelomaiset kertomukset ja 
kertomusmaisuus valtaa alaa, kun määräisten ilmausten tekstikohtainen 
määrä kasvaa (esimerkki 13). Samankaltaista trendiä noudattavat myös 
kuudesluokkalaisten tekstit: muutaman määräisen ilmauksen tekstit 
ovat pääsääntöisesti luettelomaisia kertomuksia (esimerkki 14) mutta 
painotus siirtyy kertomusmaisempaan suuntaan (esimerkki 15). 


Luettelo: 
11) Unelmieni päivä on että meidän koko perhe menisi lomalle. Kah- 
deksaksi viikoksi ja että mikään ei menisi pieleen. Eikä kukaan riitelisi 
eikä huutaisi ja että kaikki lähtisi hyvillä mielin. tai iskä ostaisi kaik- 
kea kiivaa Essille ja mulle. se olisi kivaa. Että olisi kuuma. ja se oli 
minun unelmieni päivä. (2F54) 

Luettelomainen kertomus: 
12) Olipa kerran tyttö joka oli aina melkein iloinen. ja sen tytön nimi 
oli ilona. mutta kerran hanelle tapahtui ihan outoa. kun hän meni 
kellarin hän näki siellä peikon. mutta se olikin vain vaatekasa. mutta 
kuitenkin hän säikähti. aika paljon. mutta sitten hän lopuksi nauroi. 
kuinka hassu hän oikein oli pelästy vaate kasaa. sitten häntä alkoi 
väsyttään ja meni nukkumaan. (2F36) 

Kertomus: 
13) Oli rauhallinen ja lyhyt yö, minä nukuin. Puut rapisivat ja tuuli 
puhalsi lujaa. minä heräsin ja menin ikkunaan ja huomasin kuinka 
kaunista ulkona oli. Ulkona aurinko nousi ja valaisi taivaan. Minä 
menin ottamaan viltin ja juoksin takapihalle. Minä en ollut ikinä eläis- 
säni nähnyt mitään yhtä kaunista. Levitin viltin nurmikolle ja menin 
makaamaan. Yhtäkkiä sorsia tuli viltilleni ja pyysivät leipää. Syötin 
sorsia ja he nukahtivat viltilleni. Jätin linnut rauhaan. Minä menin 
sisälle ja olin tosi onnellinen. Tämä päivä oli unelmieni päivä. Loppu. 
Tämä tapahtui minulle viime kesänä. (4M94) 
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Luettelomainen kertomus: 
14) Nukun 10.00, syön kunnon aamupalan pakkaan tavarat. Mua 
tullaan limusiinilla Hakeen. Sitten meen lentokoneella Kanadaan. Sie 
mulle on varattu jäähalli ja sie on kaikki mailman jääkiekko mailat ja 
saan testailla niitä. Sit valkkaan siita parhaat ja mee NHL-peliin illal- 
la. Teen 6 maalia ja 3 syöttö pistettä. ja mut valitaa NHL-all staariin. 
Sain siitä pelistä 10 miljoonaa ja sitten ostin tommy Hilfigerin kaikki 
vaatteet!! (6M80) 

Kertomus: 
15) Heräsin aamulla yhdeksän aikoihin lämpöiseen thaimaan au- 
rinkoon. Menimme perheeni ja isovanhempieni kanssa nauttimaan 
erinomaisesta aamupalasta. Aamiaisen jälkeen lähdimme pitkähäntä 
veneillä kohti korallisaarta. Kun nousimme maihin, lähdimme heti 
snorklaamaan ja uimaan. Söimme eväämme saaressa, jonka jälkeen 
leivän murusilla ruokimme kaloja kädestä. — — Menimme hotellille 
kahdeksan aikoihin, missä söimme ja joimme, katsoimme esityksiä ja 
meille ojennettiin stipendi ja mitali siitä, kun voitimme lusikoiden su- 
kellus kilpailun. Kävimme vielä kaiken tämän jälkeen iltauinnilla, jon- 
ka jälkeen luonnon ääniä kuunnellen menimme nukkumaan. (6M97) 


Kun määräisten ilmausten tekstikohtainen määrä kasvaa yli kuuteen, 
kertomusmaiset tekstit kasvattavat osuuttaan. Toisen luokan aineistossa 
eniten (6-25) määräisiä ilmauksia sisältäviä tekstejä on noin neljännes. 
Kertomusmaisten tekstien määrä on tässä tekstiryhmässä suurempi 
kuin aiemmin, vaikka yleisimpiä ovat luettelomaiset kertomukset. Ne 
siis sisältävät runsaasti tapahtumia, joista kertoja kuitenkin puhuu mel- 
ko yleisellä tasolla (esimerkki 16). Kertomusmaisista teksteistä taas erot- 
tuu selkeä juoni, jonka etenemistä kertoja kuvailee luettelomaisuutta 
tarkemmin (esimerkki 17). Tekstiin on kirjattu myös siirtymät tapahtu- 
masta toiseen ja tietyt asiat, kuten keskeisiin henkilöhahmoihin viittaa- 
minen, säilyvät mukana koko tekstin ajan. 


Luettelomainen kertomus: 
16) Unelmieni paivä kun minä sain hamsterin minä ruokin sitä sen 


mimi oli tipsulla oli oma juoksupyörä ja se sai olla meillä 2 vuotta 
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sitten tulin kouluun minä jätin tipsun kotiin tipsu loysi kaksikymentä 
senttiä se rupesi syömäänsitä se järsi kullat siitä pois sitten siitä tuli ho- 
pea. loppu rahat mutta minulla oli rahaa minä pistin rahat purkkiin 
niin me päästii ruotsista suomeen kulutettiin rahat. (2M188) 
Kertomus: 

17) Kun Tiina meni kerran kouluun niin hän näki että Emmalla oli 
uusi rannekello. Sitten kun Tiina tuli kotiin koulusta niin hän sanoi 
vihaisesti äidilleen: minä haluan uuden pyörän. Kun kerran Emmakin 
on saanut rannekellon ja vaikka mitä kivaa. Aina ei saa mitä haluaa 
sanoi äiti töihin keskittyneenä. Sitä paitsi huomenna on synttärini jat- 
koi Tiina. Sitten huomisaamuna Tiina meni kouluun ja tuli koulusta. 
Mutta kun hän avasi kotioven niin siellä odottivat kaikki hänen ka- 
verinsa ja äiti ja isä. Muistitte siis syntymäpäiväni sittenkin tietysti 
sanoivat äiti ja isä yhteen ääneen. Arvaapa mitä tässä paketissa on. 
Voisiko se olla kyllä on se on uusi polkupyörä kiitos äiti ja isä tämä on 
unelmieni syntymäpäivä kirjoitan sen päiväkirjaani. (2F15) 


Neljäs- ja kuudesluokkalaisten tekstit, joissa on runsaasti määräisiä il- 
mauksia, ovat suurimmaksi osaksi kertomusmaisia kirjoituksia unelma- 
päivän sisällöstä (esimerkki 18), ja niissä on selkeä juoni alkutilantei- 
neen, tapahtumien kuvailuineen ja loppuratkaisuineen. Vieläkään kaikki 
kirjoitukset eivät ole kertomusmaisia, mutta luettelot ja kuvaukset ovat 
jo harvinaisia. Runsaasti määräisiä ilmauksia sisältävät kertomusmaiset 
tekstit ovat melko pitkiä ja niissä kerrotaan tapahtumista paikoitellen 
hyvinkin tarkasti. Kerrontaan kuuluu lisäksi vuoropuhelua henkilöhah- 
mojen välillä. Runsas määräisten ilmauksien käyttö selittyykin usein 
tiettyjen asioiden tai henkilöhahmojen toistumisella. 


Kertomus: 
18) — Herätys Helka! isä huudahti. — Nyt lähdetään sukeltamaan 
merelle, isä lisäsi. — Mutta kellohan on vasta kuusi aamulla, Helka 
sanoi väsyneenä. — Jos tahdot nähdä kaloja, niin mennään! isä huu- 
dahti. Aamu Thaimaan saaressa oli hyvin lämmin. Eipä aikaakaan, 
kun minä ja isi olimme sukellusvehkeet niskassa. Hyppäsimme veteen. 
Meidän mukana oli thaimaalainen joka opasti meidät koralliriutoille. 
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Koralleja oli erivärisiä. Simpukat olivat todella hienoja. Mutta sitten 
tuli odottamani kohta. Pusukala tuli ja pussasi minua! Se oli todella 
hienoa. Keräsin sukellus reppuun simpukoita, korallia ja otin vesikame- 
rallani kuvia pusukalasta. Nousimme pintaan ja sanoin: — Kiitos isi! 
Isikin piti sukeltamisesta. Loppu. (4F23) 


Sukupuolittain tarkasteltuna erot koko aineistossa ovat selvät. Ylipäätään 
määräisiä ilmauksia käyttävien toisluokkalaisten tyttöjen ja poikien luku- 
määrä on lähes sama, mutta suurin osa pojista käyttää vain yhtä tai kahta 
määräistä ilmausta kun taas tytöillä suurin ryhmä on kolmesta neljään 
määräistä ilmausta keräävät tekstit. Suurin tiheys on pojilla 11 mää- 
räistä ilmausta tekstissä, tytöillä 25. Suuret tiheydet ovat kuitenkin yksit- 
täistapauksia. Neljäsluokkalaisten poikien aineistossa vain muutaman 
määräisen ilmauksen sisältävät tekstit kattavat lähes puolet teksteistä. 
Tyttöjen teksteissä esiintymämäärä vaihtelee enemmän. Kuudennen 
teksteissä erot ovat sukupuolittain tarkasteltuna vielä alempia luokkia 
selkeämpiä. Tyttöjen teksteissä käytetään runsaasti määräisiä ilmauksia, 
ja vain vajaassa viidenneksessä on alle seitsemän määräistä ilmausta. 
Poikien teksteille taas on tyypillistä, että määräisten ilmauksien käyttö- 
määrä jää asteikon alapäähän: alle kymmenen määräistä ilmausta on 
neljässä viidesosassa poikien teksteistä. 

Sukupuolierot näkyvät selvästi myös kaikkien luokka-asteiden teksti- 
tyyppijakaumista (ks. taulukko 29). Yleisimmät määräisiä ilmauksia 
sisältävät tekstityypit ovat toisella luokalla luettelomaiset kertomukset 
ja luettelot. Selvästi yli puolet toisluokkalaisten luettelomaisista kerto- 
muksista on tyttöjen kirjoittamia ja luetteloista runsas puolet vastaavasti 
poikien. Selkein ero sukupuolten välillä on tyttöjen kertomusmaisten 
tekstien suuri määrä. Neljännellä ja kuudennella luokalla tekstityyppien 
painopiste siirtyy kertomusmaisiin teksteihin ja luettelomaisiin kerto- 
muksiin. Kummallakin luokka-asteella yli puolet tyttöjen teksteistä on 
kertomusmaisia ja poikien puolella yleisyyttään kasvattavat luettelomai- 
set kertomukset. Samalla kuvausten ja luetteloiden määrä vähenee mo- 
lempien sukupuolten aineistossa. 
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Taulukko 29. Määräisiä ilmauksia sisältävät tekstit tekstityyppijatkumon mukaan alakou- 
lun luokilla. 


Määräiset ilmaukset ja Toinen Toinen Neljäs Neljäs Kuudes Kuudes 
tekstin tyyppi / Tytöt Pojat Tytöt Pojat Tytöt Pojat 
Ikäluokka ja sukupuoli 

Kertomusmainen 15 5 23 5 15 5 
Luettelomainen 29 20 8 23 11 23 
Keskeneräinen 2 o 3 o I 
Kuvaus 3 10 4 10 o 1 
Luettelo 17 25 2 II 2 8 


MAARAISTEN ILMAUSTEN KAYTON KEHITTYMINEN JA 
KERTOMUKSEN SYNTY 

Määräisten ilmauksien määrä kasvaa alakoululaisten teksteissä kehi- 
tyksellisesti ja samalla tekstin kertomusmaisuus kasvaa. Määräisten il- 
mauksien ja tekstityyppien suhde näkyy selvimmin, jos lasketaan jokai- 
selle tekstityypille luokittain sille ominainen määräisten ilmauksien 
mediaani. Eri tekstityypeistä kertomusmaiset tekstit ja keskeneräiset 
kertomukset saavat korkeimmat määräisten ilmauksien mediaanit. Toi- 
sella luokalla kertomusmaisten tekstien mediaani on 9,5, neljäsluok- 
kalaisilla 10 ja kuudesluokkalaisilla peräti 16. Myös keskeneräisten 
kertomusten mediaanit liikkuvat melko samoissa lukemissa. Kertomus- 
maisuuden edellytyksenä vaikuttaisi siis olevan melko runsas määräis- 
ten ilmauksien määrä. Luonnollisesti se on seurausta juonen kannalta 
olennaisten asioiden, kuten henkilöhahmojen, toistumisesta ja niihin 
viittaamisen runsaudesta. Kuudennen luokan korkeat mediaanit selitty- 
vät osin myös tekstien pitenemisellä (ks. Koulukorpuksen sanamääristä 
teoksen johdantolukua): pidempään tekstiin mahtuu enemmän uudel- 
leenmainintoja. Tosin teksti voi alakoululaisella olla pitkä myös luette- 
levuuden ja irrallisten lisien takia. 

Kertomusmaisten tekstien ja keskeneräisten kertomusten väliin sijoit- 
tuvat luettelomaiset kertomukset sisältävät selvästi vähemmän määräisiä 
ilmauksia (mediaani 4-6) kuin kertomusmaisuuteen pohjaavat teks- 
tit. Luettelomaiset kertomukset esittelevät tapahtumista vain pääkoh- 
dat, minkä takia kokonaisuus muistuttaa juonirunkoa. Tapahtumasta 
toiseen siirrytään nopeasti, jolloin toistuvien asioiden määrä vähenee. 
Toistoa — ja sitä kautta määräisten ilmauksien määrää — vähentää myös 
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kerronnan pintapuolisuus, sillä luettelomaisissa kertomuksissa asioita 
ja tapahtumia ei esitellä tai kuvailla tarkasti. Koska teksti pitää sisällään 
paljon tapahtumia, jotka vaihtuvat tiheään tahtiin, lukijalle esitellään 
paljon uusia tarkoitteita sen sijaan, että viitattaisiin toistuvasti jo tuttui- 
hin tarkoitteisiin ja rakennettaisiin teksti niiden varaan. 

Kaikkein matalimmat määräisten ilmausten mediaanit (1-3,5) löytyvät 
odotuksenmukaisesti tekstityyppijatkumon luettelomaisimmista teks- 
teistä eli kuvauksista ja luetteloista. Niiden matalat mediaanit selitty- 
nevät toiston vähäisyydellä sekä tekstin sisältämien asioiden ja tapahtu- 
mien irrallisuudella. Luettelot sisältävätkin runsaasti epämääräisiä ja 
geneerisiä ilmauksia, jotka viittaavat epätarkkaan tai yleiseen joukkoon. 
Kuvauksiksi luokiteltavat tekstit taas ovat monesti niin lyhyitä, ettei niis- 
sä edes ehditä viitata kovinkaan moneen tarkoitteeseen saati toistaa viit- 
tauksia tekstin aikana. 

Referentiaalinen koherenssi kasvaa siten selvästi kertomusmaisuu- 
den — ja kertomusrakenteen — myötä. Tavallaan tämä on kehäpäätelmä, 
koska kertomus edellyttää koherenssia, eli kertomus määritellään aina- 
kin osaksi referentiaalisten viittausten avulla. Silti on vaikea sanoa, 
onko yhteys kausaalinen (vrt. Mäkinen ja muut 2014). Referentiaalisia 
ilmauksia voi nimittäin olla melko runsaasti myös luettelomaisissa ker- 
tomuksissa. Lisäksi jo alle kouluikäiset lapset ymmärtävät ja tuottavat 
referentiaalisia viittauksia puhutussa kielessä, vaikka he eivät osaisi lu- 
kea ja kirjoittaa. Kirjoittamisen vaikeus ja siinä onnistuminen on siis 
referentiaalisista viittauksista riippumaton ongelma. 


Alakoululaisten se-tarkenteelliset määräiset ilmaukset 


Määräisten ilmauksien lisääntyminen kertomuksissa on paitsi kehityk- 
sellistä myös hidasta. Tarkastelemme lopuksi, ovatko artikkelinomaiset 
se-tarkenteet, jotka ovat tuttuja puhutussa kielessä, löytäneet tiensä kehit- 
tyvään kirjoitukseen helpottamaan määräisyyden ilmaisua. Yleensähän 
oletetaan, että lapset ensin kirjoittavat kuten puhuvat (ks. esimerkiksi 
Berman 2007). Puhutun kielen vaikutus on myös Myöhemmän kielen- 
kehityksen tutkimushankkeen yksi taustahypoteesi, jonka mukaan aloit- 
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televa kirjoittaja nojaa puhuttuun kieleen, josta sitten niin sanottu aka- 
teeminen kielenkäyttö irtautuu vähitellen (ks. teoksen johdantoluvun 
perusoletuksia). Tarkastelumme poikkeaa aiemmasta artikkelistumis- 
tutkimuksesta sekä kehitysnäkökulman että mahdollisiin esiintymisiin 
vertaamisen perusteella. Näin saadaan näkyviin tendenssin ja satunnai- 
suuden mahdollinen ero. 

Puhutussa suomessa käytetään erilaisia tarkenteita määräisyyttä il- 
maisemaan (Hakulinen ja muut 2004, 1353-1356). Tarkenteena voivat 
toimia esimerkiksi demonstratiivipronominit ja demonstratiiviset proad- 
verbit, kuten esimerkiksi viittausketjussa (yks mies) — se mies. Näistä 
erityisesti artikkelimaisen se-pronominin tarkennekäyttöä on tutkittu 
suomen osalta pitkään, sillä puhutussa kielessä painoton se on niin 
tavallinen, että sen on katsottu tehtävänsä osalta lähestyvän määräistä 
artikkelia. Tämä ei ole yllättävä kehitys: esimerkiksi Larjavaaran (2007, 
294-295) mukaan kaikissa — artikkelittomissakin — kielissä käytetään 
demonstratiiveja ilmaisemaan substantiivin tarkoitteen mainittuutta tai 
muuta tuttuutta. Lauryn (1996, 162) mukaan jo Setälä (1883) oli ha- 
vainnut, että se-pronominia käytetään puhekielessä määräisen artikkelin 
tapaan. Setälän jälkeen se- ja ne-pronominitarkenteiden käyttöön ja artik- 
kelimaistumiseen ovat ottaneet kantaa muun muassa Larjavaara (1990), 
Laury (1996) sekä Juvonen (2000). Artikkelistumiskeskustelu ei kuiten- 
kaan ole johtanut yksimielisyyteen, ja joka tutkijalla tuntuu olevan oma 
näkemyksensä tarkenteen käyttötiheydestä ja tehtävästä. 

Se-tarkenteellisia ilmauksia tarkastellaan kaikilta alakoulun luokilta, 
jotta esimerkkejä löytyisi riittävä määrä. Aineistossa on nyt yhteensä 
40 ooo sanaa ja tässä sanamäärässä se- tai ne-demonstratiivipronominia 
käytetään substantiivia määrittävänä tarkenteena vain 78 kertaa. Lähes- 
kään kaikki kirjoittajat eivät ylipäätään käytä tarkenneilmauksia, vaan 
niitä esiintyy vain noin joka kymmenennessä (11,5 %) tekstissä. Suku- 
puolittain tarkasteltuna tilanne on tasainen. Tarkenteellisten ilmausten 
käyttäminen on harvinaista myös siinä mielessä, että suurin osa käyttää 
se- tai ne-tarkennetta tekstissään vain kerran (ks. taulukko 30). Siten 
myös tekstikohtaisten esiintymämäärien perusteella käyttö näyttää har- 
vinaiselta. Toisen, neljännen ja kuudennen luokan aineistojen kaikkiin 
määräisiin ilmauksiin suhteutettuna tarkenneilmauksien osuus jää kul- 
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lakin vuosiluokalla alle kolmeen prosenttiin. Prosenttiosuus näyttäisi 
vielä pienenevän iän mukaan, mutta aineisto on varsinaiseen kvanti- 
tatiiviseen tarkasteluun hieman pieni. Kokonaisuudessaan voi todeta, 
että tarkenneilmauksien käyttö on sattumanvaraista eikä osoita se- ja 
ne-artikkelin syntyä tai yleistymistä kehittyvään kirjoitettuun kieleen. 


Taulukko 30. Se/ne-tarkenteiden määrä teksteittäin eri ikäluokilla. 


Tarkenteiden määrä tekstissä / Ikäluokka Toinen Kolmas Neljäs Viides Kuudes 


Yksi tarkenne 10 14 9 II 7 
Kaksi tarkennetta 2 4 I I I 
Kolme tarkennetta I 2 


Suurin osa (79,5 %) aineiston se-tarkenteellisista määräisistä ilmauksista 
on luokiteltavissa määräisyyden tyyppitapauksiksi eli uudelleenmainin- 
noiksi, joiden avulla viitataan johonkin tekstissä jo aiemmin mainittuun 
tarkoitteeseen. Uudelleenmaininnalla voidaan viitata tuttuun tarkoit- 
teeseen joko aiemmin mainitun substantiivin avulla (esimerkki 19) tai 
esimerkiksi synonyymisellä ilmauksella (esimerkki 20). Uudelleenmai- 
ninnan kriteeri ei siis ole saman sanan tai lausekkeen esiintyminen 
uudelleen tekstissä, vaan kaikki samaan tarkoitteeseen viittaavat sanat 
lasketaan uudelleenmainintojen ryhmään. Kokonaisuudessaan uudel- 
leenmainintojen ryhmä on kuitenkin varsin heterogeeninen, ja valtaosa 
ryhmän tarkenteellisista ilmauksista on yksittäistapauksia, jolloin yksi 
määräinen ilmaus merkitään tarkenteella vain yhden kerran tekstin ai- 
kana. Uudelleenmainintojen systemaattinen merkitseminen pronomini- 
tarkenteella ei siis ole tavanomaista oppilaiden tuottamissa koulukirjoi- 
telmissa. 


19) Olen ratsastus leirillä siellä oli paras hoitohevonen Sillä minä hy- 
pin esteitä ja laukkasin ja kävin maastossa ja nukuin tallin ylä kerras- 
sa valvoin yöllä ja pesin varusteita mutta sitten aamulla ne varusteet oli 
märät ja mun pitilainata tunnille toisen hevosen satulaa. (3F1) 

20) Olipa kerran pieni makkaran näköinen koira. Se meni lottoa- 
maan. Ja 2 tunnin päästä se sai Lotto voiton. Mutta koira rupesi katu- 
maan mitä oli oikein tehnyt. Koska hän ei tiennyt mitä tekisi niillä 
rahoilla. (2F 41) 
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Muita aineistossa esiintyviä se-tarkenteellisen määräisen ilmauksen viit- 
taussuhteita ovat kehyksen kautta tuttuun tarkoitteeseen viittaaminen 
(11,5 %) tai ensimaininnan käyttäminen (9 %). Kehyksen kautta tunne- 
tun tarkoitteen tuttuus perustuu toiston sijaan jonkin edellä esitetyn 
ilmauksen aktivoimaan kehykseen (esimerkki 21). Jo ensimmäisellä 
mainintakerrallaan tarkenteella merkityn ilmauksen avulla taas tuodaan 
keskusteluun uusi tarkoite, jonka tekstin tuottaja olettaa olevan jossain 
mielessä tuttu vastaanottajalle. Tarkenteellisen ensimaininnan tuttuus 
voi perustua esimerkiksi tekstin henkilöhahmojen yhteiseen tietoon 
tekstin kuvaamasta maailmasta tai siihen, että tarkoite saa selityksensä 
tai tulkintakontekstinsa pian ensimaininnan jälkeen (esimerkki 22).5 
Sekä kehyksen kautta tuttuun tarkoitteeseen viittaavat että jo ensimai- 
ninnassa esiintyvät pronominitarkenteet ovat kuitenkin hyvin harvinai- 
sia tässä aineistossa. 


21) Tai sitten voisin mennä väikka pariisiin. Ja pariisissa voisi katsella 
sitä ihanaa tornia joka pariisissa on. (3F39) 

22) Pääsen idolini Rihannan konserttiin, sillä hän on saapunut Suo- 
meen, joka on yksi niistä maista, joissa hän kiertueellansa käy. (6F19) 


Lopuksi 


Referentiaalinen koherenssi eli tunnistettava diskurssireferentteihin 
viittaaminen ja ylipäätään koherenssi eli tekstien yhtenäisyys, loogisuus, 
tapahtumajärjestyksen huomioonottaminen, ajallinen ja paikallinen 
sijoittuminen jne. lisääntyvät kehityksellisesti. Kehitys alkaa puhutun 
kielen yhteydessä jo esikouluiässä, mutta kirjoittamisen osalta kehitys 
on paljon hitaampaa. Osa alakouluikäisistä hallitsee viittaussuhteiden 
ilmaisun jo alakoulun alussa, mutta keskimäärin kehitys nopeutuu ala- 
koulun keskivaiheilla ja jatkuu koko alakoulun ajan. Vaikka lapsi hallit- 


50 Perinteisen kieliopin mukaan esimerkissä (22) on kyse kataforisesta, tekstissä eteenpäin viittaavasta 
pronominista (ks. Penttilä 1963, 514) eikä varsinaisesta artikkelimaisesta käytöstä. 
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sisi monia viittaussuhteiden kielellisen merkinnän keinoja jo varhain, 
aikuistason semanttis-pragmaattinen hallinta saavutetaan (keskimäärin) 
alakoulun loppupuolella. Kehityksen taustalla on monia kielenulkoisia 
tekijöitä. Kronologisen iän lisäksi mielen teorian on oltava riittävän ke- 
hittynyt, jotta lapsi osaa ottaa huomioon viestin vastaanottajaa. Vastaa- 
vasti lapsen on kyettävä riittävästi kontrolloimaan toimintaansa, jotta 
hän pystyy suunnittelemaan tekstin tuottoa. Olemme tässä luvussa tut- 
kineet referentiaalisten ilmauksien käyttöä rajaamalla tarkastelun mää- 
räisiin ilmauksiin eli sellaisiin substantiivilausekkeisiin, joita voidaan 
tarvittaessa rajata pronomineilla. Tutkimuksen aineistona on ollut ala- 
kouluikäisten lasten vapaasti tuottamia kirjoitelmia annetusta aiheesta 
eli niin kutsuttuja Unelmakirjoitelmia. 

Kirjoitelmien koherenssi lisääntyy asteittain siten, että sekä määräis- 
ten ilmauksien määrä että kirjoitelmien kerronnallisuus kertomusra- 
kenteen kautta määriteltyinä lisääntyvät. Nuorimpien tekstit ovat usein 
yhden lauseen epätekstejä tai eriasteisesti epäkoherentteja. Tekstikohe- 
renssi kasvaa kirjoitelmien rakenteen alkaessa noudattaa kertomus- 
rakennetta ja viittaussuhteiden kehittyessä täsmällisiksi. Suurin osa ai- 
neiston kirjoittajista on tässä vaiheessa vasta alakoulun lopussa. Tytöillä 
tekstikoherenssi kehittyy eritahtisesti poikien kanssa. 

Määräisillä ilmauksilla ilmaistaan niin sanottua tuttua informaatiota 
eli tekstiin tavalla tai toisella jo tuotua informaatiota, jota jatkossa täy- 
dennetään. Tutun informaation referentin täytyy olla palautettavissa kon- 
tekstista, sen status voi olla havainnon kannalta salientti tai sitten tuttuus 
perustuu oletettuun tuttuuteen. Nuorimmilla alakouluikäisillä oletettu 
tuttuus on keskeinen tuttuuden muoto. Alakouluikäinen olettaa elinym- 
päristönsä kuulija-lukijan kannalta tutuksi ja tuo perheeseen, kouluun 
ja ystäviin viittaavia ilmauksia esittelemättä tekstiin. Osaksi tuttuus on 
ymmärrettävissä tilanteisen ja kulttuurisen aktivoinnin kautta. Jos teksti 
on hyvin epäkoherentti, määräisiä ilmauksia on vähän tai ei ollenkaan: 
teksti luettelee unelmakohteita eikä kerro unelmapäivän sisällöstä. 

Alakouluikäisten määräisiä ilmauksia ei voi arvioida esimerkiksi 
Gundelin ja muiden (1993) tapaan implikatiivisella annettuusasteikolla, 
koska huomion kohteena ja aktivoituneena voi olla myös ilmaus, joka ei 
ole identifioitavissa tekstin tasolla. Siten kehittyvää kieltä voidaan mää- 
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räisten ilmauksien kannalta arvioida myös suhteessa siihen, miten ne 
vielä rikkovat erilaisia asteikkoja — kuten tekstikoherenssin asteikkoa, 
annettuusasteikkoa, saavutettavuusasteikkoa ja niin edelleen. Alakoulu- 
ikäinen ja häntä nuorempikin kyllä ymmärtää referentiaalisia ilmauksia 
ja niiden puutteita ja kykenee myös tuottamaan niitä mutta parhaiten 
ohjeistetussa kontekstissa. Erityisesti luova kirjoittaminen on lapsen 
kannalta haastavin konteksti. Tämä johtuu suorituksen moniulottuvuu- 
desta ja haastavuudesta ja tietoisen referentiaalisten ilmauksien tuotta- 
misen kuormittavuudesta. 

Määräisten ilmausten käytöllä on yhteys tekstin kokonaisrakenteen 
edustamaan tekstityyppiin: sekä tekstien kertomusmaisuus että määräis- 
ten ilmausten tekstikohtainen esiintymismäärä kasvavat alemmilta luo- 
kilta ylemmille siirryttäessä. Määräisten ilmausten käytön lisääntyminen 
koulunkäynnin edetessä näyttää siis liittyvän kertomusmaisen tekstilajin 
hallintaan, kun luettelomaisuus tekstissä samalla vähenee. Määräiset 
ilmaukset eivät kuitenkaan lisäänny tasaisesti, vaan määräisten ensimai- 
nintojen osuus vähenee ja määräisten uudelleenmainintojen osuus kas- 
vaa, kun siirrytään alemmilta luokilta ylemmille. Tämä voi olla merkki 
esimerkiksi siitä, että tiettyihin tarkoitteisiin viitataan toistuvasti tekstin 
aikana eli ne pysyvät mukana tekstissä aiempaa kauemmin. Määräisten 
uudelleenmainintojen suhteellisen osuuden kasvu voi liittyä myös teks- 
tin sisäisen koherenssin kasvuun, sillä yksi yhtenäisen tekstin piirre on 
samasta tai samoista tarkoitteista puhuminen läpi koko tekstin. On kui- 
tenkin muistettava, että tekstissä toistuviin tarkoitteisiin voi viitata myös 
pronominin avulla, mihin tämä tutkimus ei kiinnitä huomiota. Tarkoit- 
teiden toistuvuudesta ja tekstin koherenssista saisikin kattavamman ku- 
van tutkimalla myös pronominiviittauksia ja selvittämällä, kuinka usein 
yhden tekstin määräiset ilmaukset liittyvät samaan tarkoitteeseen. 

Kun määräisiä ilmauksia tarkastellaan lajeittaisten käyttömäärien 
näkökulmasta, havaitaan sekä ensi- että uudelleenmainintojen kohdalla, 
että tarkenteella merkittyjen substantiivilausekkeiden osuus kasvaa 
ylemmille luokille siirryttäessä. Tämä voi viitata esimerkiksi tekstien tar- 
koitteiden aiempaa huolellisempaan esittelyyn ja määrittelyyn. Tarkoite 
siis joko esitellään määräisenä heti alusta alkaen tai sidotaan myöhem- 
mässä vaiheessa esimerkiksi jonkin henkilöhahmon ominaisuudeksi. 
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Tarkoitteiden huolellisempaan määrittelyyn liittynee myös kvantitatiivi- 
sesti määräisten ensimainintojen osuuden kasvu. Pelkän mainittuu- 
den perusteella määräisten uudelleenmainintojen lisääntyminen taas 
viitannee tarkoitteiden pysyvyyteen ja toistuvuuteen tekstissä. Tämä voi 
esimerkiksi pienentää tekstin sisältämien tarkoitteiden kokonaismäärää, 
mihin viittaa sekä ensi- että uudelleenmainintojen kohdalla havaittava 
tuttuihin tarkoitteisiin viittaavien ilmauksien osuuden väheneminen. 
Tällöin tekstit sisältävät esimerkiksi aiempaa pienemmän henkilöhahmo- 
joukon. 

Vaikka tekstien kokonaistarkoitemäärä vähenisikin ylemmille luokka- 
asteille siirryttäessä, kasvavat tekstien sisältämät määräisten ilmauksien 
esiintymämäärät. Täytyy kuitenkin muistaa, että samalla kasvaa myös 
tekstikohtainen kokonaissanamäärä, joten määräisten ilmausten esiinty- 
mistiheys voi olla vanhempien informanttien teksteissä lähes samaa 
luokkaa kuin nuorimmilla kirjoittajilla. Koska määrällistä kehitystä kui- 
tenkin tapahtuu juuri määräisten ilmauksien suurimpien tekstikohtais- 
ten esiintymämäärien kohdalla, niiden käyttö lisääntyy kirjoitustaidon 
kehittyessä. Tähän viittaa myös se, että vain muutamia määräisiä il- 
mauksia sisältävien tekstien osuus kaikista luokka-asteen teksteistä pie- 
nenee ylemmille luokka-asteille siirryttäessä. 

Samalla kun määräisten ilmauksien esiintymämäärät kasvavat ja 
ensi- ja uudelleenmainintojen lajeittaiset osuudet muuttuvat, lisääntyy 
myös tekstien kertomusmaisuus: kuudesluokkalaisten teksteistä nimit- 
täin jo reilusti yli puolet on luokiteltavissa kertomusmaisiksi teksteiksi 
tai luettelomaisiksi kertomuksiksi. Mediaanien valossa näyttäisikin siltä, 
että kertomusmaisuus vaatii muita tekstityyppejä enemmän määräisiä 
ilmauksia. Tämä selittynee sillä, että hyvässä kertomusmaisessa tekstis- 
sä tietyt asiat toistuvat usein ja pysyvät mukana kertomuksessa, jolloin 
myös määräisten ilmauksien kokonaismäärä väistämättä kasvaa. 

Määräisten ilmauksien esiintymämäärä ei kuitenkaan näytä vaikutta- 
van se- ja ne-demonstratiivitarkenteella merkittyjen ilmausten esiintymi- 
seen. Ne ovat harvinaisia joka luokka-asteella, ja pääasiassa niitä käyte- 
tään vain kerran tekstin aikana. Aineiston valossa näyttäisikin siltä, ettei 
suomen kielen se-pronomini ole ainakaan laajamittaisesti kehittymässä 
kirjoitettuun kieleen määräiseksi artikkeliksi. 
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Johdanto 


Moniäänisyys tarkoittaa Bahtinin (1991 [1963]) mukaan kerronnan kie- 
lellistä moniaineksisuutta, joka tulee esiin paitsi kertomuksen rakentees- 
sa myös sen välittämässä ideologiassa. Moniäänisyyttä on tekstiin raken- 
nettu moninäkökulmaisuus ja tulkintojen vaihtoehtoisuus. Muutokset 
kertojan tai puhujan osallistujaroolissa rakentavat moniäänisyyttä. Moni- 
äänisyys näkyy, kun jokin kertomuksen aines aktivoituu uudessa kehyk- 
sessä. Martin ja White (2005, 102-104) katsovat moniäänisiksi sellaiset 
ilmaukset, joissa aiemmat näkemykset ja aiheesta aiemmin sanottu 
tuodaan tekstissä jollakin tavalla näkyviin. Yksiäänisiä puolestaan ovat 
ilmaukset, joissa ei näy, että asiasta on tai voisi olla useampia tulkintoja 
(Martin & White 2005, 98-102). Useissa viimeaikaisissa tutkimuksissa 
moniäänisyyttä tarkastellaan lisäksi vuorovaikutuksen näkökulmasta (ks. 
esimerkiksi Juvonen 2014; Virtanen, Rahtu & Shore 2018). Moniääni- 
syyden ilmenemismuotoja ovat muun muassa intertekstuaalisuus, iro- 
nia, metatekstuaalisuus, retoriset kysymykset sekä avoin toiseen puhe- 
tilanteeseen viittaaminen eli referointi. Moniäänisyyttä tuotetaan eri 
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tekstilajeissa erilaisin kielellisin valinnoin, ja ne synnyttävät erilaisia 
merkityksiä ja tulkintoja. Kertovassa tekstissä moniäänisyys on aikuisten 
kohdalla tyypillisesti tekstien välistä intertekstuaalisuutta sekä saman 
tekstin sisäistä toiseen puhetilanteeseen viittaamista, toisen tai oman 
puheen referointia (ks. esimerkiksi Kalliokoski 2005). 

Kehittyvässä (kertovassa) kielessä moniäänisyyden ilmaisu on vielä 
vakiintumatonta ja aluksi hyvin yksinkertaista. Pääosin ilmaisu on yksi- 
äänistä. Kaikki moniäänisyyden lajit tuovat teksteihin kerroksellisuutta ja 
kompleksistavat myös tekstin syntaktista rakennetta, ja siksi on jo lähtö- 
kohtaisesti oletettavaa, että moniäänisyyttä rakentavien ilmaisukeinojen 
tavoittaminen vaatii aikaa. Unelmakirjoitelmissa ehkä yksinkertaisinta 
moniäänisyyttä edustavat alakoululaisten kirjoitelmien yksittäiset vie- 
raskieliset sanat, erisnimet, kuten pelien nimet sekä auktoriteettien 
— kuten isän ja äidin — mielipiteitä kaiuttavat asenteiden ilmaisut ja luki- 
jan puoleen kurkottaminen (Unelmakirjoitelmista ks. tämän teoksen 
johdantoa). Aloituksissa ja lopetuksissa voidaan irrottautua kerronnasta 
metakielisin aineksin tai esittelemällä kertoja. Kaikkein nuorimpien eli 
ensimmäisen luokan oppilaiden Unelmakirjoitelmissa ei ole lainkaan 
suoraa eikä epäsuoraa esitystä ja muutkin moniäänisyyden ilmaisumuo- 
dot ovat lähes olemattomissa. Varsinainen referointi, puhujan tai kerto- 
jan puheen ilmaisukeinojen hallintaan otto on monen tutkimuksen mu- 
kaan kesken vielä 12-vuotiailla ja jopa 15-vuotiailla eli ikäryhmissä, joihin 
tässä luvussa keskitytään. Kehitys ei myöskään näytä täysin lineaariselta 
eli ikäkaudesta toiseen tasaisesti kehittyvältä (ks. esimerkiksi Nordgvist 
2001; Köder 2016). 

Moniäänisyyden ilmenemismuodoista referointi on ehkä tutuin ja 
tutkituin. Referoinnin oppiminen kestää kauan muun muassa siitä syys- 
tä, että se edellyttää kykyä vaihtaa perspektiiviä puhujasta kertojaan ja 
kykyä kuvitella, mitä vastaanottaja tietää, eli mielen teorian kehittynei- 
syyttä (Astington & Baird 2005; Doherty 2009). Vaikka oppiminen on 
hidasta, referoinnin esittämistavat ovat kuitenkin melko helposti mallin- 
nettavissa toisin kuin vaikka ironian ja intertekstuaalisuuden. Referointi 
ilmenee kielellisesti muun muassa spatiaalisen, referentiaalisen ja tem- 
poraalisen deiksiksen muutoksina ja kehyslauserakenteina. Nuorim- 
pien unelmakerronnassa erityisesti tempuksen esittäminen huojuu ja 
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kertomus noudattaa tarinan aikaa useimmiten kronologisesti ja ilman 
tiivistyksia (ks. Vesala 2012). 

Puhutussa ja kirjoitetussa kielessä moniäänisyyden ilmaisu eroaa huo- 
mattavasti sekä ilmaisumuodoiltaan että funktioiltaan — vaikka yhtymä- 
kohtiakin on — mutta oppimisen ja käytön lähtökohtana on puhutun kie- 
len suora esitys (Nordgvist 2001). Puhutussa kielessä moniäänisyyden 
luonnollinen esittämistapa on multimodaalinen: esityksessä voidaan 
käyttää hyväksi paitsi kieltä myös kasvojen ilmeitä, eleitä, äänensävyä ja 
muita prosodian keinoja sekä toiminnan esittämistä (re-enactment) (ks. 
Strömgvist, Nordqvist & Wengelin 2004; Good 2015; Hodge & Gormier 
2019). On selvä, että puhujan äänen näin kokonaisvaltainen esittäminen 
antaa paljon mahdollisuuksia myös sisällön ja esittäjän arvottamiseen. 
Kertoja ei yleensä toista puhutun eikä kirjoitetun kielen suorassa esi- 
tyksessä koko sanallista esitystä sellaisenaan vaan valitsee kontekstin 
edellyttämän osan esityksestä. Aiemmin katsottiin, että suora esitys olisi 
sanatarkkaa — operoitiin niin sanotulla sananmukaisuuskriteerillä — ja 
että epäsuora esitys olisi enemmän tiivistelmä esityksen tietosisällöstä. 
Todellisuudessa ero on paljon suhteellisempi. 

Suoran ja epäsuoran esityksen sisällöllistä eroa on filosofiassa kuvattu 
termeillä de dicto ja de re; suunnilleen samaa ilmaistaan termeillä de- 
piktiivinen eli esittävä ja deskriptiivinen eli kuvaileva (Nordgvist 2001). 
Puhutussa kielessä tämä eronteko vastaa suoraa ja epäsuoraa esitystä, 
mutta kirjoitetussa kielessä suoraa esitystä voidaan tiivistää puhuttua 
enemmän ja painottaa kertojan haluamalla tavalla. Tiivistys on välttä- 
mätöntäkin, koska muisti ja ajallinen etäisyys asettavat rajansa. Kirjalli- 
suudessa tehdään ero myös raportoivan ja projektoivan esityksen välille 
(Nordgvist 2001). Ensimmäisessä on kyse jonkin todellisuudessa sano- 
tun referoinnista (speech reporting) ja jälkimmäisessä fiktiivisestä ainek- 
sesta (speech projecting). — Projektio-termi on käytössä myös hieman laa- 
jemmassa mielessä (ks. esimerkiksi Shore 2005). 

Tämän tutkimuksen aineistossa eli Unelmakirjoitelmissa on tässä 
mielessä aina kyse fiktiivisen maailman projektiosta, koska ei voi tietää, 
referoivatko kirjoittajat jotain oikeasti tapahtunutta tai vain kuviteltua. 
Tehtävänannossa kirjoittajia ohjeistettiin kirjoittamaan unelmapäivästä, 
joka on tapahtunut, jonka toivoisi tapahtuvan tai joka voisi tapahtua, jos 
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mikä tahansa olisi mahdollista (Pajunen 2012). Nuorimpien unelmat on 
kirjoitettu näiden vaihtoehtojen mukaan, ja kaksi viimeistä vaihtoehtoa 
tuottavat aina fiktiivisen kontekstin. Vanhemmilla kirjoittajilla täysin 
fiktiiviset kirjoitelmat ovat vähissä, mutta heillä kerrontaa täydentää ar- 
viointi ja kuvailu. Myös tekstityyppi- ja lajivaihtelut hankaloittavat suo- 
ran esityksen todenperäisyyden arviointia, jos se muuten olisikin mah- 
dollista. Ongelma koskee erityisesti luovaa kirjoittamista. Raportoivan 
ja projektoivan kerronnan ero on sen sijaan helpompi — ehkä helpoin 
— tehdä kontekstissa, jossa kielentäminen on perustunut kuva-aineis- 
toon eli tilanteessa, jossa arviointiin on ulkoinen kriteeri. 

Puhuttu kieli rakentuu paitsi peräkkäisesti myös samanaikaisesti, kir- 
joitettu ainoastaan peräkkäisesti. Kirjoitetussa kielessä toisen puhe pitää 
esittää yksin kielen keinoin, mikä antaa vain vähän välineitä ilmaista pu- 
hujan ja puheen ei-sanallisia ominaisuuksia. Tyypilliset vaihtoehdot ovat 
illokutiivisia sävyjä ilmaisevat kehys- tai johtolauseen puheaktiverbit (sa- 
noa > vaikertaa, valittaa, uhkailla; kilahtaa), tavan adverbit tai arvottavat 
adjektiivit (sanoa rumalla äänellä, huutaa rumasti), imitatiivit (olin että 
auts) sekä välimerkit (!!?) ja erilaiset tekstin muotoon ja asetteluun liitty- 
vät typografiset keinot. Nuorimmilla peruskoululaisilla imitatiivit ja ar- 
vottavat välimerkit ovat Unelma-aineistossa jo monipuolisesti käytössä, 
mutta esimerkiksi puheaktiverbien, tavan adverbien ja adjektiivien kirjo 
kasvaa aikuisikään asti muun leksikaalisen diversiteetin kasvun myötä 
(ks. Pajunen 2012). Verbeillä voi hyvin ilmaista illokutiivista sävyä — esi- 
merkiksi väittää, kysyä, todeta ja valittaa — tai henkilön puhumistapaa ja 
olemusta tarkemmin kuin yleisverbillä sanoa; alakoululaisten kirjoitel- 
missa sanoa-verbi on silti vielä lähes yksinomainen. 

Referointi liitetään tyypillisesti kertovaan tekstiin, jossa sen keskeise- 
nä funktiona on kuljettaa juonta kronologisesti eteen päin (Vincent & 
Perrin 1999, 292; Nordgvist 2001). Vincent ja Perrin määrittelivät laa- 
jan ranskankielisen haastatteluaineiston avulla kertovan tekstin refe- 
roidut lauseet Labovin (1972; 1982) jaotteluun tukeutumalla niihin, 
joiden funktio oli narratiivinen, ja niihin, joilla oli muita funktioita. 
Nämä ei-narratiiviset referoivat lauseet he edelleen jaottelivat evaluoiviin 
(appreciative: judgment or opinion), tuen (support) tai auktoriteetin ilmai- 
suihin. Tuloksena oli, että yli puolet suorasta esityksestä omaa aineistos- 
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sa narratiivisen funktion mutta epäsuorasta vain 34 prosenttia. Epäsuo- 
rista esityksistä suurin osa on auktoriteetin ilmaisuja, tietoa siitä, kehen 
tekstin argumentaatiossa vedotaan. 

Referoidun puheen multifunktionaalisuudesta puhuu myös Berman 
(1996): funktio voi olla paitsi puhujan ilmaiseminen, myös evaluointi, 
depiktiivinen tai deskriptiivinen esittäminen, esityksen elävöittäminen, 
etäisyyden luominen tai juonen edistäminen. Referoidun puheen funk- 
tiot erilaistuvat myös tekstityypin ja -lajin mukaan; erittelevässä tekstissä 
referoitu puhe on epäsuoraa esitystä ja ei-narratiivista funktioltaan (Köder 
2016). Funktio vaikuttaa muun muassa siihen, miten referoinnin sisältö 
pitää kielentää ja mitä edellytyksiä vastaanottajalla on sisältöjä ymmär- 
tää. Nykynäkemysten mukaan niin sanottu pragmaattisen tason ilmiö- 
kielentäminen liittyykin vahvasti kielentämistilanteen fyysiseen ympäris- 
töön, erilaisiin sosiokulttuurisiin tekijöihin sekä ikäkaudelle ominaisiin 
kielellisiin resursseihin. Lisäksi taustalla vaikuttavat iän lisäksi kielentä- 
jien yksilöpsykologiset ominaisuudet (Bohnemeyer ja muut 2014; Mar 
2004). Jos narratiivin ja erittelevän tekstin referoitujen lauseiden funk- 
tiot ovat erilaisia, vastaavasti niiden ymmärtäminen on erilaista, koska 
edelliseen liittyy referoitujen tapahtumien osallistujia, joiden intentiot, 
tavoitteet ja tunteet pitää ja voi tavoittaa, mutta jälkimmäisessä ei ole 
näin selviä tekijöitä, joihin tulkintaa voi perustaa (ks. Mar 2004). Lisäksi 
on hallittava modaliteettierot eli osattava referoida sekä puhutun että 
kirjoitetun kielen konventioiden mukaan. 

Ymmärrys moniäänisyyden ja etenkin referoinnin moninaisuudesta 
on kasvanut 2000-luvulla tehdyn tutkimuksen myötä paljon, mutta sa- 
malla myös jo tehty tutkimus on käynyt vaikeammin arvioitavaksi, koska 
on ymmärretty saatujen tulosten vaihtelevan metodien, koehenkilöiden 
iän ja tekstityyppien mukaan. Unelmakirjoitelmissa tavoitemuoto on 
kertova ja kirjoitelmat lähestyvät tätä muotoa vähittäin. Ala- ja yläkoulun 
päättövaiheessa kirjoitelmat ovat jo pääosin kertovia. Kirjoitelman teema 
eli unelmien päivä kuvataan usein hyvin toiminnallisesti tai vanhimmil- 
la arvottavasti; erityisesti arvottava käsittelytapa näyttää vierovan suoraa 
esitystä. Aikuiskirjoitelmissa myös omaelämäkerrallisuus kasvaa ja lisää 
toisaalta yksiäänistä kerrontaa, toisaalta kokijanäkökulmaa ja vapaata 
epäsuoraa esitystä tai eläytymisesitystä. 


MONIÄÄNISYYDEN ILMAISUN KEHITTYMINEN PERUSKOULUN PÄÄTTÖVAIHEIDEN ... 203 


https://doi.org/10.21435/skst.1472 


On hyvin tunnettua, että suoran ja epäsuoran esittämisen kielellisiä 
eroja ei voi esittää jyrkällä kahtiajaolla piirre kerrallaan määritellen vaan 
ennemmin jatkumoluonteisena (Maier 2009; Evans 2012; suomesta 
mm. Ikola 1961, Hakulinen, Vilkuna, Korhonen, Koivisto, Heinonen & 
Alho 2004; Niinimäki 2015). Erityisesti kehityksellisessä kontekstissa 
eronteko ei voi olla kovin jyrkkä. Typologisessa kontekstissa ajatus on, 
että kielten vertailu referoinnin ilmaisussa on valtavan merkinnän kir- 
jon vuoksi lähes mahdotonta, vaikka voidaan esittää joitakin kanonisen 
suoran ja epäsuoran esityksen ominaisuuksia. Suoralla esityksellä on 
kielissä Evansin (2012) mukaan selvimmät määriteltävät ominaisuudet 
ja ilmeisesti vain suora esitys esiintyy kaikissa kielissä — epäsuorassa 
esityksessä on sen sijaan vaihtelua sen mukaan, miten moni tekijä on 
muun muassa deiktisissä muutoksissa mukana. Vaihtelu koskee eri- 
tyisesti tempusta ja toisaalta logoforisia johtolauseen puhujaan viittaa- 
via referaatin pronomineja. Suomessakin tulee referoinnin yhteydessä 
esiin hän- ja se-pronominien logoforinen vaihtelu (ks. esimerkiksi Kallio 
1978). Kielikohtainen vaihtelu voi myös näkyä sääntöjen tiukkuuden 
eroina. Esimerkiksi saksa ja hollanti eroavat Köderin (2016) mukaan 
siinä, miten tiukasti alisteisen lauseen käänteistä sanajärjestystä on 
noudatettava — ja vastaavasti siinä, miten selvästi suora ja epäsuora esi- 
tys eroavat kielellisesti. 

Kehityksellisessä kontekstissa kirjoitetun kielen suorassa ja epäsuo- 
rassa esityksessä näkyy samantapainen monensuuntainen huojunta, 
ja ongelmat ovat selvimmät juuri luovassa kirjoittamisessa, josta kuva- 
elisitoinnin tapainen kielentämis- ja vertailumalli puuttuu. Keskityn täs- 
sä yhteydessä tarkastelemaan, miten kuudes- ja yhdeksäsluokkalaiset 
ilmaisevat kirjoitelmissaan moniäänisyyteen liittyvää intertekstuaali- 
suutta, metatekstiä, miten he esimerkiksi puhuttelevat lukijaa eli ovat 
tietoisia toisesta näkökulmasta ja miten he ilmaisevat suoraa ja epäsuo- 
raa esitystä ja niiden välimuotoja. Joitain havaintoja esitän koko Unelma- 
aineistosta. Tarkastelen vielä ennen varsinaista analyysiä, miten refe- 
rointitaitojen kehitystä on aiemmin tutkittu ja mitä on saatu selville. 
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Kehityksellinen näkökulma 


Pienet lapset oppivat ilmaisemaan puhutussa kielessä moniäänisyyttä 
— etenkin suoraa esitystä — hyvin nuorina. Jo noin kaksivuotiaat matkivat 
toista ääntä puheessaan ja noin kolmivuotiaina he käyttävät myös epä- 
suoraa esitystä (esimerkiksi Nordqvist 2001). Kansainvälistä kehityksel- 
listä tutkimusta laajemmin määriteltävän moniäänisyyden kielentämi- 
sestä ei juuri näytä olevan ja referoinnistakin sitä on tehty suhteellisen 
vähän. Tutkimusta on myös paljon enemmän puhutusta kuin kirjoite- 
tusta kielestä. Uusin tutkimus näyttää kohdistuvan puhutun kielen mul- 
timodaaliseen suoraan esitykseen (ks. esimerkiksi Hodge & Gormier 
2019) tai erityisryhmien tutkimukseen (ks. esimerkiksi Engberg-Peder- 
sen & Vang Christensen 2017). Puhutun ja kirjoitetun kielen kontekstis- 
sa laajoja kehityksellisiä tutkimuksia on tehty ainakin ruotsin (Nordqvist 
2001) sekä saksan ja hollannin (Köder 2016) kielistä. Kummassakin on 
mukana useita ikäryhmiä 2-5-vuotiaista lapsista koululaisryhmiin (9-, 
12- ja 15-vuotiaat) ja aina nuoriin aikuisiin. Esimerkiksi englantia on 
tutkittu pienimuotoisemmin (Goodell & Sacks 1992; Hickmann 1993). 
Suomessa peruskouluikäisten referointitaidoista ei ole paljoa tutkimus- 
ta ikäryhmätasollakaan, mutta Kalliokoski (2005b) on tutkinut suomea 
toisena kielenä kirjoittavien abiturienttien ja yhdeksäsluokkalaisten 
tekstien moniäänisyyttä ja koherenssia sekä Juvonen (2014) epäsuoraa 
esitystä ylioppilasaineaineistolla. Ylioppilasaineiden referointikeinojen 
toteutumista ja merkitystä tekstissä on kartoittanut myös Berg (2011). 
Metakielellistä ainesta ilmaisevia aloituksia ja lopetuksia on myös tutkit- 
tu jonkin verran (ks. esimerkiksi Komppa 2012). Tämä tutkimus pyrkii 
vastaamaan erityisesti kouluikäisten referointitaitoja kartoittavan tutki- 
muksen tarpeeseen. 

Moniäänisyyden ilmaisun kehittymistä on siis tutkittu eniten puhu- 
tussa kielessä ja metodina ovat useimmiten olleet roolileikkien leikittä- 
minen tai kuvakirjaelisitaatio. Etenkin Frog where are you -tarinan (Mayer 
1969; Berman & Slobin 1994) avulla on tuotettu suullista kerrontaa 
ja uudelleenkerrontaa, lisäksi uudemmissa tutkimuksissa on mukana 
multimodaalinen kerronta. Myös kirjoitustutkimus perustuu ennen 
kaikkea kuvaelisitaatioon, mutta luovan kirjoittamisen yhteydessä moni- 
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äänisyyden ja referoinnin ilmaisun kehittymistä ei ole tietääkseni laajem- 
min tutkittu. Kuvaelisitaatio toisaalta tukee tutkimusasetelman luomis- 
ta, toisaalta nostaa vaatimustasoa, koska se edellyttää visuaalista lukutai- 
toa (ks. Harris Wright, Capilouto, Srinivasan & Fergadiotis 2011). Tutki- 
musten vertailtavuutta heikentää se, että varhempi tutkimus on usein 
perustunut melko pieniin koehenkilöryhmiin. Toisinaan tuloksia on 
myös vaikea tulkita, koska aiemmin ei niinkään kiinnitetty huomiota sii- 
hen, että tulokset voivat riippua käytetyistä metodeista ja tekstityypeistä. 

Moniäänisyys näyttääkin olevan ilmiönä suhteellisen altis tutkimus- 
metodille. Se millä menetelmällä aineisto tuotetaan, vaikuttaa muun 
muassa siihen, missä funktiossa kielellinen aines esiintyy ja miten 
yleistä se on. Narratiivien juonta edistävä referointi on koetilanteissa 
helpompi tuottaa kuin tietoa tai kokemusta välittävä. Psykolingvistinen 
tutkimus osoittaa, että moniäänisyyden ilmaisumuoto vaikuttaa myös 
ymmärtämiseen ja taustalla oleviin muistiedustumiin (ks. Ferland & 
Zwaan 2018). Suora esitys koetaan eloisammaksi ja havaittavammaksi, 
mutta epäsuoran esityksen kautta kertomuksen päähenkilö muistetaan 
paremmin. Eerlandin ja Zwaanin (2018) koesarjassa esityksen muodon 
vaikutusta sisällön muistamiseen ei löytynyt, vaikka koehenkilöillä oli 
ongelmia viittaussuhteiden ymmärtämisessä. Köderin ja Maierin (2016) 
mukaan lapsilla on ongelmia viittaussuhteiden tulkinnassa suorassa 
mutta ei epäsuorassa esityksessä. Tilanne kuitenkin vaihtelee asetelman 
mukaan: suora esitys on lapsille vaikeampi tulkita silloin, kun asetelma 
on rakennettu tiedonvälittämiseen, mutta ei silloin, kun se on narratii- 
ville tyypilliseen tapaan rakennettu juonen eteen päin kuljettamiseen 
(Köder & Maier 2018). Referoinnin ja deiktisten muutosten yhteydessä 
kompleksistuvien kerroksellisten viittaussuhteiden ymmärtämistä onkin 
tutkittu eniten (ks. esimerkiksi Köder 2016) ja tällainen asetelma on 
helpoin rakentaa elisitaation pohjalle. Yleensä ajatellaan, että ymmärtä- 
minen edeltää tuottamista — eli kun ymmärretään esimerkiksi komplek- 
sisia viittaussuhteita, niitä pystytään tuottamaankin — mutta toisinaan 
suhde voi olla myös asymmetrinen (Hendriks 2014). Kehityksellinen 
konteksti vaikeuttaa arviointia entisestään. 

Yleisiä aiheita referointitutkimuksessa ovat olleet myös käytettyjen 
muotojen ja funktioiden kehittyminen, erilaisten sekaantumamuotojen 
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esiintyminen sekä erilaiset kehystykset, kuten johtolauseen esiintymi- 
nen referoinnissa ja johtolauseessa käytetyt verbit sekä moniäänisyyden 
ilmaisun rajojen merkintä välimerkeillä (ks. esimerkiksi Goodell & 
Sacks 1992). Nordgvistin (2001) mukaan vielä kaksitoistavuotiaista noin 
20 prosenttia ei anna lukijalle vihjettä siitä, kenen puhetta referoidaan 
tai millä ilmaisun tasolla liikutaan. Unelma-aineistossa peruskoululaiset 
eivät käytä suoran esityksen konventionaalisia välimerkkejä kovinkaan 
ahkerasti. Muutama viidesluokkalainen käyttää lainausmerkkejä ja hie- 
man useampi kuudesluokkalainen myös kaksoispistettä. Deiktisistä 
muutoksista parhaiten huomioidaan henkilöviittaukset. 

Kansainvälisen tutkimuksen mukaan moniäänisyyden ja etenkin re- 
feroinnin kehitys alkaa aina puhutusta kielestä ja suorasta lainauksesta, 
joka on aluksi tyypillisesti sanatasoista. Kyse on oikeastaan sanatason 
intertekstuaalisuudesta. Monista lähinnä kuvaelisitaatioon perustuvista 
tutkimuksista käy ilmi, että kehitys on hyvin hidasta. Eri ikäryhmillä 
voi myös olla erilaisia preferenssejä moniäänisyyden ilmaisun keinoja 
valitessaan. Goodell ja Sacks (1992, 414—416) osoittivat, että yhdeksän- 
vuotiailla ja aikuisilla oli enemmän epäsuoraa (60 %) kuin suoraa esi- 
tystä, mutta kuusivuotiaat suosivat samassa elisitointitehtävässä suoraa 
esitystä. Nuorimmilla on vaikeuksia ottaa kuulija huomioon. Suorassa 
esityksessä nuorimmat koehenkilöt antavat yleensä äänen tarinan (kuva- 
kirjan tai vastaavan) päähenkilölle mutta vanhimmat kaikille henkilöille. 
Ero näkyy hyvin myös sammakkotarinan kirjallisesta kielentämistehtä- 
västä. Nordqvistin (2001) aineistossa kouluikäiset koehenkilöt referoivat 
pääosin päähenkilön eli pienen pojan tekemisiä ja jättivät tarinan muut 
henkilöt eli sammakon, koiran ja etsintäreitillä kohdatut muut eläimet 
huomiotta tai ilmaisivat näitä esimerkiksi imitatiivein. Teksteissä oli pal- 
jon ambivalentteja viittaussuhteita ja informaatiota oli selvästi vähem- 
män kuin vanhemmilla kirjoittajilla. Viisitoistavuotiailla suora esitys vä- 
heni ja kaikista ikäryhmistä juuri viisitoistavuotiaat käyttivät epäsuoraa 
esitystä eniten. Heidän tuotoksissaan ei-verbaaliset ja paralingvistiset 
piirteet olivat näkymättömissä ja marginalisoituneet. Referoinnin sisäl- 
lön illokutiivisten sävyjen ilmaisu puheaktiverbien variaationa oli edel- 
leen vähäistä. Aikuiset tuottivat sammakkotarinoita monessa mielessä 
yhdeksänvuotiaiden tavoin, mutta erona yhdeksänvuotiaisiin aikuiset 
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projisoivat puhetta laajempaan henkilöjoukkoon ja käyttivät samalla 
useammanlaisia syntaktisia rakenteita helpottaakseen puhujan identi- 
fiointia. Heidän leksikkonsa oli muita rikkaampi ja he yhdistivät puhe- 
aktiverbejä ja tavan adverbejä ilmaistakseen epäsuorassa esityksessä 
esimerkiksi puhumistavan ilmaisuja (frågade B. förvirrad ”kysyi B. häm- 
mentyneenä’). Monista tutkimuksista käy ilmi paitsi moniäänisyyden 
ilmaisukeinojen hidas omaksuminen myös kehityksen ei-lineaarisuus 
ja eri-ikäisten erilaiset preferenssit. Semanttis-pragmaattisella tasolla 
kehitys on ylipäätään hidasta (Berman 2004; 2007). 

Tarkastelen tässä yhteydessä peruskoululaisten Unelmakirjoitelmien 
avulla, miten moniäänisyyden ilmaiseminen kehittyy alakoulusta ylä- 
kouluun. Analysoin systemaattisesti toistasataa Myöhemmän kielen- 
kehityksen tutkimushankkeen kuudes- ja yhdeksäsluokkalaisten Unelma- 
kirjoitelmaa, jotka on kerätty vuonna 2014, mutta perustan analyysini 
moniäänisyyden ilmaisukeinojen kartoitukseen laajemmasta aineistos- 
ta. Kartoitus on tarpeen, koska luovan kirjoittamisen osalta kehityksel- 
linen tutkimus on niin vähäistä. Aloitan tarkasteluni kokoamalla aikai- 
semman tutkimuksen havaintoja siitä, miksi moniäänisyyttä voidaan 
pitää hyvän kertomuksen ominaisuutena ja yhtenä rakennetekijänä. In- 
tertekstuaalisuus on koululaisten kirjoitelmissa melko vähäistä — usein 
sanatasoista — ja tulkinnallista, se on mielenkiintoista muun muassa, 
koska se kaiuttaa nuorten kulttuuritaustaa. Korpus itsessään tarjoaa run- 
saasti materiaalia sen havainnoimiseen, kuinka hyvän kertomuksen kir- 
joittaja ottaa lukijansa huomioon ja kuinka hän nousee oman tekstinsä 
yläpuolelle metatekstin kautta. Huomattava osa aineistoni tarkastelusta 
liittyy kuitenkin referointiin, jonka avulla kirjoittajat tuovat tekstiinsä 
oman tai jonkun muun aiemman äänen tai oman ajatuksensa. Erityi- 
sesti tarkastelen, kuinka kokemuksellisuuden ilmaisu kehittyy ja kuin- 
ka tekstiä etäännytetään kertojasta: millä tavoin tuodaan kokeva minä 
kertovan minän rinnalle? Elisitoidulla aineistolla ei ole suoraan ollut 
mahdollista tutkia kokemuksellisuuden ilmaisua, joten kirjoitetussa ke- 
hityksellisessä kontekstissa näkökulma on uusi. 


208 ANNELI NIINIMÄKI 


https://doi.org/10.21435/skst.1472 


Kertovan tekstin moniäänisyys 


Labovin (1972, 361-262; 1982) mukaan kertomuksen runko koostuu 
narratiivisista, temporaalisesti orientoituneista lauseista ja niin sanotuis- 
ta vapaista lauseista, joista puuttuu temporaalisesti orientoiva aines. Va- 
paat lauseet eivät liity ajallisesti kerronnan tapahtumiin eivätkä vie sitä 
eteenpäin; niiden tehtävä on ennen kaikkea evaluoiva, kuten jo mai- 
nittiin. Fludernik (1966, 43-46) puhuu kertomuksen kokemukselli- 
suudesta (experientiality), sen kyvystä heijastaa inhimillistä kokemusta. 
Kertomus merkitsee kertojalle jotain tunteen tasolla ja on sen vuoksi 
kertomisen arvoinen. (Vrt. Hyvärinen 2012, 403.) Unelmakirjoitelmien 
tehtävänanto ja otsikko suorastaan johdattelee kokemuksellisuuden ilmi 
tuomiseen. Melkein kaikissa aineistoni teksteissä on tarinaan osallistu- 
va minäkertoja — tai ainakin sen käyttöön siirrytään aloituksen jälkeen. 
Koko alakoulun aineistossa hallitsee minämuotoinen kertojanääni (Vesa- 
la 2012, 77). Minäkerronnan rakenteista voidaan erottaa kertova minä ja 
kokeva minä (Stanzel 1985 [1979], 135). Rakenteet eivät kuitenkaan ole 
täysin vastakohtaisia vaan kohtaavat tapauksissa, joissa kertojan ääni 
yhtyy henkilön ääneen (vapaa epäsuora esitys). Kertova minä kuljettaa 
kerrontaa eteenpäin, kääntyy lukijan puoleen ja kommentoi. Reflektoiva, 
kokeva minä taas tuo esiin kertojan tunteita, ajatuksia ja havaintoja. 
(Stanzel 1985 [1979], 222; Cohn 2006 [1999], 120-121.) Voi jopa kysyä, 
onko kertomus tekstilajinsa mukainen, ellei se ole moniääninen. Hyvä 
kertomus ei etene tapahtumasta toiseen, vaan kertoja voi keskeyttää sen 
eri tavoin, muun muassa puheen tai ajatusten esittämisellä, referoinnil- 
la. Kerronta keskeytyy silloinkin, kun kertoja kääntyy kuulijan tai lukijan 
puoleen ja kertoo tälle, mistä on kysymys, tai esittää muita kommentte- 
jaan. Keskeytys on merkki siitä, että tekstissä on mukana evaluoiva näkö- 
kulma. (Vrt. Labov 1972, 370-373.) 

Esimerkissä 1 kuudesluokkalaisen kertomus etenee narratiivisin lau- 
sein, joiden predikaatit ovat toimintaa ilmaisevia (heräsin, kävelin, läh- 
din, mentiin, käytiin ja niin edelleen). Havaintoa, ajattelua ja asenteita 
ilmaisevat verbit puuttuvat. Lukijalle ei välitetä kokemusta siitä, millaista 
on elää kuvattujen tapahtumien läpi. Kirjoitus on yksiääninen lukuun 
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ottamatta ensimmäisen kappaleen viimeistä virkettä, jossa referaatissa 
tuodaan esiin äidin ääni: 


1) Eräänä aamuna, kun heräsin kävelin alakertaan syömään aamu- 
palaa, kun olin syönyt lähdin kavereitten kanssa ulos. me mentiin ui- 
maan. Uimisen jälkeen me lähdettiin kaupungille. Kavereitten kanssa 
me käytiin koskikeskuksessa jäätelöllä. Minä lähdin kotiin, mutta kun 
olin kotona äiti sanoi, että nyt lähdetään Eedenii (kylpylään). 

Kello oli 6 päivällä kun tultiin kylpylästä minä lähdin taas kavereit- 
ten kanssa ulos. Illalla, kun tulin kotiin menin nukkumaan. (6F9)" 


Kalliokoski (2005b, 234) toteaa suomea toisena kielenä opiskelevien yh- 
deksäsluokkalaisten kirjoittajien tekstien kertomuksellisuuden olevan 
paradoksaalisesti kyseenalainen tapauksissa, joissa kertomus koostuu 
pelkistä kertovista lauseista. Asiantilojen muodostama kokonaisuus jää 
saavuttamatta. Referoinnin puuttuminen korostaa ”epäkertomuksen” 
vaikutelmaa: Olipa kerran auto varas. Se varasti autoja joka päivä. Se asui 
Itäkeskuksessa kun saapui yö hän lähti keikkaa autoja se lähti Itäkeskuksen 
ostarille siellä oli sellainen auto kuin MAZDA 626, jonka rekisteri oli LHG- 
223 se meni — —. Seuraavassa esimerkissä 2 on oman aineistoni yhdeksäs- 
luokkalaisen moniääninen teksti: 


2) Tulen kotiin noin yhdeltä — kuusi tuntia peliin — kun puhelin soi. 
Vastaan, ja siellä on Rasse, joka pyytää tulemaan noin 45 min aikai- 
semmin hallille hiomaan vielä ylivoimaa. Vastaan tulevani ja suljen 
puhelimen. Pohdin, mitä enää on tehtävissä. menen yläkertaan otta- 
maan päiväunia. Katson jälleen kelloa ”miksi olen näin hermostunut”. 
— — En ole enää varma, mitä teen väliajalla, kun ovikello soi odot- 
tamatta. Kävelen rappuset alas ja avaan oven — se on Joonas, paras 
kaverini jo valmiina kooveen tuulipuvussa ”Huh, ulkona on kylmä!” 
hän heittää heti kävellessä ja yhdyn — ulkona todella on kylmä. Alan 
pakkaamaan ja kysyn, soittiko Rasse Joonaksellekin, joka vastaa kyllä. 


(9M1) 


51 Aineistoviitteestä käy ilmi luokka-aste, kirjoittajan sukupuoli (F, M) ja kirjoitelman numero. 
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Esimerkissä 2 moniäänisyys luodaan eri keinoja käyttämällä. Kertoja 
etäännyttää kerronnan kerrontahetkestä ja ottaa erilaiset äänet mukaan. 
Katkelmissa kuljetetaan toimintaa eteenpäin: tullaan kotiin, vastataan 
puhelimeen, valmistaudutaan illan peliin ja tavataan kaveri, mutta kerto- 
ja keskeyttää tapahtumien kuvailun toistuvasti. Kertojan puhetta referoi- 
daan puheaktina (vastaan) ja epäsuorana esityksenä (vastaan tulevani; ky- 
syn, soittiko Rasse Joonaksellekin). Kertojan ajatuksia referoidaan vapaana 
epäsuorana esityksenä (kuusi tuntia peliin; ”miksi olen näin hermostunut”; 
ulkona todella on kylmä) ja epäsuorana esityksenä (Pohdin, mitä enää on 
tehtävissä). Kahden muun henkilön puhetta esitetään puheaktina (pyytää 
tulemaan) ja suorana esityksenä (”Huh, ulkona on kylmä!”; kyllä). Kir- 
joittaja siis muuttaa esitystavasta toiseen tiheästi, ja kertova minä sekä 
kokeva minä vaihtuvat. Rakenteena on johtoilmaus sekä siihen liitetty 
referaatti, mutta kirjoittaja luottaa paikoin lukijan kykyyn erottaa kokeva 
minä myös ilman johtoilmausta. Esimerkit 1 ja 2 heijastavat evaluoinnin 
kehityksellistä lisääntymistä aineistossa. 

Moniäänisyyden tuottamisesta kehityksellisessä kontekstissa on suo- 
men osalta vähän tietoa, ja etenkin luovassa kirjoittamisessa kansainväli- 
nenkin tutkimus on olematonta. Perustan siksi tämän tutkimukseni var- 
sinaisen kehityksellisen analyysin alakoulun kirjoitelmien avulla tehtyyn 
kartoitukseen,” josta selviää, miten moniäänisyys syntyy ja miten se li- 
sääntyy alakouluikäisten kirjoitelmissa. Jokainen kirjoitelma on arvioitu 
sen mukaan, esiintyykö jokin moniäänisyyden ilmaisukeino vähintään 
kerran vai ei lainkaan. Moniäänisyyden tyypeiksi on katsottu interteks- 
tuaalisuus, metakieliset tapahtumakontekstin ulkopuolelle viittaukset, 
suora ja epäsuora esitys sekä vapaa epäsuora esitys muunnelmineen. 
Taulukkoon 31 on yksinkertaisuuden vuoksi merkitty vain, monessako 
kirjoitelmassa esiintyy suoria viittauksia lukijaan (mutta ei muuta meta- 
tekstiä) sekä suoraa tai epäsuoraa esitystä, koska nämä oli laskennalli- 
sesti helpoin tavoittaa. Ne ovat myös kouluikäisillä moniäänisyyden ke- 
hityksellisesti tärkeimmät ilmenemismuodot. Suora ja epäsuora esitys 
erottuvat kehittyvässä kirjoituksessa toisistaan selvimmin referentiaali- 


52 Jaottelu on tehty vuoden 2006 aineiston avulla; varsinainen analyysini perustuu vuoden 2014 aineis- 
toon, koska vuoden 2006 aineistossa ei ole yläkoululaisten kirjoitelmia. 
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sen deiksiksen perusteella (X kysyi menettekö te vs. menemmekö me), 
joten esitykset on laskelmissa eroteltu juuri persoonadeiksiksen avulla. 
Epäsuora esitys rajautuu lähinnä johtolauseen avulla erottuviin, joten 
periaatteessa taulukkoon ei ole merkitty vapaata epäsuoraa esitystä tai 
ajatusten referointia; ne eivät kuitenkaan ole alaluokille ominaisia moni- 
äänisyyden muotoja. 

Ensimmäisen luokan aineistossa ei ole varsinaisesti moniäänisiä 
tekstejä, mutta intertekstuaalisuutta on jonkin verran: kirjoittajat viittaa- 
vat esimerkiksi peleihin ja kirjoihin. Jo toisluokkalaisten kirjoitelmissa 
moniäänisyyttä ilmaistaan useammalla keinolla mutta yhä vähän: viides- 
osassa kirjoitelmista käytetään suoraa esitystä vähintään kerran, epä- 
suoraa esitystä on yhteensä vain neljässä kirjoitelmassa ja suora viittaus 
lukijaan yhdessä. Koko alakoulun aineistossa suoran esityksen määrä 
vaihtelee hieman tytöillä mutta kasvaa pojilla iän mukaan. Epäsuoran 
esityksen määrä kasvaa alakoulussa lähes lineaarisesti mutta suku- 
puolittuneesti omaa tahtiaan. Alakoulun aineistossa moniäänisyyttä il- 
maistaan monipuolisimmin viidennellä luokalla, joten kasvu on selvän 
kehityksellistä, kuten oletus oli. Monet kirjoittajat, jotka moniäänisyyttä 
ylipäätään ilmaisevat, ilmaisevat sitä useammin kuin kerran. Lukijan 
suora puhuttelu lisääntyy muun moniäänisyyden lisääntyessä ja se tulee 
tyypillisesti esiin samoissa kirjoitelmissa, joissa on myös referointia. Se 
selvästi edellyttää kirjoittajalta kykyä ottaa lukija huomioon, ja kirjoitel- 
mat, joissa lukijaa puhutellaan, ovat myös kertomusskeeman mukaisia 
(Labov & Waletzky 1967). Lukijaa huomioidaan myös epäsuoremmin 
erilaisin metakielisin keinoin. Esimerkiksi Vesalan (2012) mukaan aloi- 
tuksissa ja lopetuksissa on iän mukaan enenevästi metatekstiä. Metakie- 
lisiä aloituksia ja lopetuksia ei ole merkitty taulukkoon 31. 

Käsittelen jatkossa moniäänisyyden ilmaisua kuudennen ja yhdeksän- 
nen luokan oppilailla Unelmakorpuksessa eli vuoden 2014 aineistossa 
sen kehityksellisessä ilmenemisjärjestyksessä eli etenen intertekstuaali- 
suudesta metakieleen ja lukijan puhutteluun sekä lopulta varsinaiseen 
referointiin. 
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Taulukko 31. Moniäänisyyden ilmaisukeinojen osuus alakoululaisten kirjoitelmista. 


Tkäluokka / Kirjoitelmia Lukijan puhuttelu Suora esitys — Epäsuora esitys 
Moniäänisyys % % % 
L. F 57 o o o 
1 M 55 o o o 
2. F 80 1,3 22,5 3,7 
2.M 83 o 7,3 1,2 
3. F 53 3:7 13,2 75 
3. M 72 2,7 12,5 2,8 
4. F 93 5.4 30,1 12,9 
4. M 93 2,2 12,9 11,8 
5. F 75 13,3 36,0 33:3 
5.M 79 12,6 22,8 25,3 


Intertekstuaalisuus ja metateksti 


Intertekstuaalisuus ja metateksti edellyttävät lapselta pragmaattisen 
kompetenssin kehittyneisyyttä, jotta hän pystyy viittamaan tekstinsä 
ulkopuolelle tai kommentoimaan omaa tekstiään. Moniäänisyyden il- 
maisukeinot voivat vielä olla hakusessa, mutta kirjoitelmista välittyy pyr- 
kimys päästä vuorovaikutukseen lukijan kanssa. Käsittelen ensin kuu- 
des- ja yhdeksäsluokkalaisten Unelmakirjoitelmien intertekstuaalisuutta 
ja sitten niissä ilmenevää metakieltä. 


INTERTEKSTUAALISUUTTA ETSIMÄSSÄ 

Laajimman määritelmän mukaan (Barthes 1979 [1971], 169) kaikki kir- 
jalliset tekstit ovat intertekstuaalisia, koska kaikkiin teksteihin on ku- 
toutunut sitaatteja, viitteitä tai kaikuja toisista teksteistä. Nämä piirteet 
ovat usein jo tunnistamattomia, niin että niitä on mahdoton jäljittää. 
Suppeamman määrittelyn mukaan (Fairclough 1992, 84-85, 101-105; 
Solin 2006, 83) intertekstuaalisuudeksi luetaan lukijan jäljitettävissä 
oleva suora viittaus, teoksen nimi, sitaatti, lainausmerkein osoitettu toi- 
nen teksti mutta myös implisiittisemmät suhteet kuten alluusiot. Tällöin 
lainattu aines tekee uuden tekstin moniääniseksi ja antaa mahdollisuu- 
den erilaisiin tulkintoihin, dialogiin kirjoittajan ja lukijan välillä. 


MONIÄÄNISYYDEN ILMAISUN KEHITTYMINEN PERUSKOULUN PÄÄTTÖVAIHEIDEN ... 213 


https://doi.org/10.21435/skst.1472 


Lapsi kertoo ja kuvailee teksteissään sitä todellisuutta, jossa hän elää. 
Jo hyvin nuorena (esikouluikäisenä) lapsi saattaa tuoda tekstiinsä inter- 
tekstuaalisia piirteitä ja hänen tekstinsä voi teknisistä puutteista huoli- 
matta olla intertekstuaalista ja moniäänistä (Kauppinen 2012, 592-593; 
vrt. Nordgvist 2001; Köder 2016). Moniäänisyyttä kannattelevaksi inter- 
tekstuaalisuudeksi (vrt. Seppänen 2015, 40) riittänee yleisluontoinenkin 
viittaus esimerkiksi muualta luettuun tai kuultuun tietoon. Moniääni- 
syyden määrittely kaipaa kehittyvien kirjoittajien kohdalla kuitenkin ra- 
jauksia ja tarkennusta, sillä vielä peruskoulun päättövaiheessakin inter- 
tekstuaalisuus on tulkinnallista. 

Selkeästi tunnistettavat intertekstuaaliset viittaukset edellyttävät luke- 
neisuutta tai ylipäätään elämänkokemusta. Siksi ei ole yllättävää, että 
aineistoni kertomuksissa niitä on vain vähän lukuun ottamatta esimer- 
kiksi teosten ja pelien nimiä. Kuitenkin jo kuudesluokkalainen osaa 
luoda kerrotun maailman, jossa on viittauksia hänen lukemiensa teos- 
ten tai tuntemiensa pelien maailmoihin: Unelmani on se että pokemonit 
olisivat totta. Tiedän ettei se ole mahdollista mutta on kuin olisin nähnyt 
Pidoven. (6M13). Kirjoittajan intertekstuaaliseen varantoon kuuluvat 
Pok&mon-pelisarjan lajit. Viittauksia elokuviin ja muihin populaarikult- 
tuurin muotoihin on sekä kuudes- että yhdeksäsluokkalaisten kertomuk- 
sissa: unelmien päivänä haluttaisiin nähdä muun muassa Spider-Man 4 
ja X-Men: Days of Future Past. Kuvaavasti erisnimiä on Unelma-aineiston 
nuorimmilla kirjoittajilla huomattavasti enemmän kuin vanhemmilla. 

Kertovan fiktiivisen tekstin moniäänisyyttä syntyy myös silloin, kun 
siirrytään tarinamaailmasta toiseen todellisuuteen. Kouluteksteissäkin 
näin tapahtuu. Toinen todellisuus ja moniäänisyys luodaan paikan mää- 
rittein ja intertekstuaalisin viittauksin esimerkiksi suosikkiyhtyeisiin ja 
suosikkipeleihin. Konditionaalin käytöllä luodaan illuusio kuvitellusta 
todellisuudesta. Esimerkissä 3 kertoja siirtyy unelmassaan Las Vegasiin 
ja toteuttaa siellä urheilijan unelmaansa. Esimerkissä 4 kertoja puoles- 
taan johdattaa lukijan vaihtoehtoiseen todellisuuteen suosikkibändiä 
tapaamaan: 


3) Minun unelmieni päivänä pääsisin Las Vegasiin katsomaan UFC:tä. 
Haluaisin nähdä Jon Jonesin. — — Katsoisin elokuvia kavereiden kans- 
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sa elokuva teatterissa. Hyppdisin lasku varjo- ja benji hypyn. valmistui- 
sin yliopistosta ja juhlisin koko yön. voittaisin olympia kultaa. (9M6) 
4) Syömässä ollessamme saisimme viestin One Directionin manageril- 
ta. Hän kertoisi että pääsemme tapaamaan heitä! Kun olisimme syö- 
neet limusiini veisi meidät toiseen, hienompaan hotelliin, jossa One 
Direction odottaisi meitä. (9F26) 


Esimerkissä 5 konditionaalin avulla ei luoda toista todellisuutta, mutta 
kirjoittajalla on alluusioita toisiin kulttuureihin (jalkapuuhun kytkemi- 
nen; hiljainen hetki ja kertojalle kumartaminen) sekä yhteiskunnallista 
tietämystä (kansanedustajien lainsäädäntövalta): 


5) Unelmieni päivä olisi sellainen, että ei olisi koulussa sääntöjä koko 
päivänä ja että kaupassa saisi hakea kaikkea ilmaseks. Sitten, Saksa 
pyyhittäs maailmankartalta ja että kaikki Aasialaiset teloitettaisiin 
(ei sillä että mulla ois jotain aasialaisia vastaan mutta se on ärsyttävä 
maan-osa). Lisäksi kaikki kansanedustajat laitettaisiin jalkapuuhun, 
kunnes ne lopettaa pakollisten verojen antamisen. 

Sekä jokaisen suomalaisen täytyy pitää päivän aikana hiljainen het- 
ki ja kumartaa mulle. 
PS. en ole sadisti (9M3) 


Esimerkin 5 teksti on aineistoni ainoa ironisesti kaksiääninen teksti. Kir- 
joittaja osoittaa kriittisyyttä tehtävänantoa tai aihetta kohtaan valitsemal- 
la unelmien päivän toiveiksi pahennusta herättäviä asioita ja esittämällä 
aggressionsa aasialaisten teloittamisesta sekä kansanedustajien jalka- 
puuhun laittamisesta. Hän kuitenkin selittää puhettaan ja lähestyy 
lukijaa kahdella huomautuksella: (ei sillä että mulla ois jotain aasialaisia 
vastaan mutta se on ärsyttävä maan-osa); PS. en ole sadisti. Kyseessä on 
selvästi kaksiääninen puhe. Kriittistä asennetta tehtävään osoittaa paitsi 
lähestymistapa myös harkitut puhekielisyydet ilmaseks, pyyhittäs, mulla 
ois, mulle. Kysyä voi, kuinka suuri on ollut kirjoittajan motivaatio. 
Koululaisten hyvin lyhyet, muutaman virkkeen kirjoitukset viitanne- 
vat nimenomaan motivaation puuttumiseen, kirjoittamishaluttomuu- 
teen, eivät pelkästään kirjoittamisen taitotasoon tai kirjoittajan kielelli- 
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siin kykyihin. Alakoulun Unelmakirjoitelmia tutkinut Vesala (2012, 54) 
toteaa, että suuri joukko kuudesluokkalaisia poikia on laatinut erittäin 
suppean tekstin, ja kysyy myös, onko kyse kirjoitustaidosta vai kieltei- 
sestä asennoitumisesta oppiainetta tai tehtävänantoa kohtaan — vai mo- 
lemmista. Niin ikään yhdeksäsluokkalaisten kohdalla alisuoriutuminen 
on pojille tyypillisempää kuin tytöille. Kirjoitelman ironinen, halveksuva 
tai aggressiivinen sävy on merkki oppilaan kielteisestä suhtautumisesta. 
Sen sijaan viittaukset omaan kirjoittajaidentiteettiin antavat kuvan posi- 
tiivisesta kirjoittajakuvasta (Seppänen 2015, 48). 

Esimerkin 5 kirjoittaja ehkä alisuorittaa, mutta kirjoittamisen perus- 
taidot tuntuvat olevan hallinnassa. Molemmilla päättötason luokka- 
asteilla aineiston konditionaalissa kirjoitetut kertomukset ovat valtaosin 
lyhyitä ja luettelomaisia sekä yksiäänisiä. Konditionaalissa kirjoitetut 
tekstit ovat varsinkin yhdeksäsluokkalaisilla melkein kaikki poikien 
kirjoittamia, ja myös kuudennella luokalla valtaosa lyhyistä konditio- 
naaliteksteistä on poikien tekemiä. Esimerkissä 6 moduksen käyttö 
on lukinnut kirjoittajan kerrontatilanteeseen ja vaikeuttanut tekstin 
laventamista moniääniseksi. Teksti etenee pelkin narratiivisin lausein 
(predikaatteina alkaisi, tulisi, lähtisin, kävisimme, syötäisiin): 


6) Unelmien päivä alkaisi Rauhallisella herätyksellä. Aamupala tulisi 
vuoteeseen. Aamupalan jälkeen lähtisin perheen ja kavereiden kanssa 
huvipuistoon. Kävisimme kaikissa laitteissa. Lounas syötäisiin ravinto- 
lassa. (6M3) 


Vähäinenkin intertekstuaalisuus osoittaa, että kirjoittajalla on jo kykyä 
laventaa näkökulmaansa tietoisesti yli ulkoisen tapahtumasarjan. En- 
simmäisen luokan aineisto myös osoitti, että moniäänisyyden luonti 
kirjoitettuun kieleen alkaa yksinkertaisilla viittauksilla luettuun ja koet- 
tuun. 


53 Unelmakirjoitelmien sanamäärä kasvaa koko peruskoulun ajan. Keskimäärin poikien sanamäärä on 
60 % tyttöjen kirjoitelmien sanamäärästä. Sanamäärä osoittaa ikäluokan keskimääräistä kehitystä 
etenkin alakouluikäisillä (Pajunen 2012, 13). 
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METATEKSTI — LUKIJAN HUOMIOON OTTAMISTA 

Myöhemmän kielenkehityksen vaiheessa lapset kehittyvät narratiivisen 
puheen tuottajista narratiivisen tekstin tuottajiksi ja tekstien suunnitel- 
mallisuus lisääntyy (Tolchinsky 2004, 240). Lapsen pragmaattinen 
kompetenssi kehittyy (vrt. Blum-Kulka 2004, 192-193, 201; Nippold 
2006; Makkonen-Craig 2011), mikä on edellytys varsinaisen moniääni- 
syyden syntymiselle. Puheen muuttaminen kirjalliseksi kerronnaksi 
tuottaa useita tekstuaalisia muutoksia ja kehitys näkyy muun muassa 
siinä, että lapsi oppii ottamaan lukijan huomioon tekstin tuottamisessa 
eikä kerro asioita pelkästään oma itsensä keskipisteenä. 

Aineistoni kuudes- ja yhdeksäsluokkalaisten teksteissä löytyy kerto- 
muksen metatasoon kuuluvaa vuorovaikutukseen kategorisoitavaa 
moniäänisyyttä, oman tekstin tai tekstin tuottamisen asettamista kom- 
mentoinnin kohteeksi ja tietoisen vuorovaikutuksen luomista lukijaan 
— tai ainakin sellaisen tavoittelua. Pyrin seuraavaksi selvittämään, millä 
kielen keinoilla kuudes- ja yhdeksäsluokkalaiset luovat moniäänisyyttä, 
kun he kääntyvät lukijan puoleen. Miten nämä evaluoivat kohdat kes- 
keyttävät kerronnan ja mitä funktioita niillä on? Millaisia eroja on kuu- 
desluokkalaisten ja yhdeksäsluokkalaisten keinoissa? 

Käsittelen tekstejä fiktiivisinä teksteinä, vaikka niissä on kirjoittajan 
oman elämän yksityiskohtia mukana. Kirjoituksissa luodaan hypoteetti- 
nen maailma, joka tosin rikkoutuu, kun kertoja kääntyy lukijan puoleen 
ja viittaa kirjoitustilanteeseen. Otan huomioon kirjoittajan ja kertojan 
eron ja tarkastelen kirjoittajan ja lukijan valintoja moniäänisyyden tul- 
kinnoissa. Koska pohjaan tarkasteluni tekstiin, en näe tarkoituksenmu- 
kaiseksi käyttää fiktiivisten tekstien lukemiseen käytettävää sisäislukijan 
käsitettä (vrt. Virtanen, Rahtu, Shore 2018, 19-20). 

Perinteinen koululaisdiskurssi eroaa muista diskursseista. Sillä on 
oma kommunikaatiotilanteensa, koulukirjoittamiskontekstinsa, ja teks- 
tit kirjoitetaan usein koulussa tiettynä rajattuna aikana yhdelle lukijalle, 


54 Opetusmaailmassa kirjoittamisen diskurssit ovat muuttumassa, ja mukaan on tullut genrediskurssin, 
prosessidiskurssin ja luovuusdiskurssin myötä sosiaalisen diskurssin piirteitä (Kallionpää 2017, 84). 
Laajan kirjoittamistaidon opettaminen tähtää luku- ja kirjoittamiskäytänteiden muuttumiseen, jolloin 
painotetaan, että koululaiset kirjoittavat eri välinein erilaisissa tekstiympäristöissä tekstejä, joissa 
kommunikatiiviset tavoitteet ovat perinteistä koulukirjoittamista keskeisempiä. 
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opettajalle. Tällä seikalla on merkitystä nimenomaan sen suhteen, mi- 
ten kirjoittaja ottaa lukijan huomioon. Myös Unelmakirjoitelmien ala- 
kouluikäisten kommunikaation tyypillinen piirre on suora kontakti vas- 
taanottajaan (Vesala 2012, 76-77). Unelmakirjoitelmat tehtiin opettajan 
kontrollista irrallaan tutkimuskäyttöön mutta kuitenkin aikuislukijoille. 
Mielenkiintoinen kysymys on, kenen puoleen kuudesluokkalainen kir- 
joittaja kääntyy, kun hän aloittaa kirjoituksensa Moi! Minä olen Teppo 
tai Hei! Olen Vilma tai lopettaa sanoilla Heh tai No, nyt tiedätte ainakin 
osan ”Unelmieni päivän” tapahtumista? Tuttavalliset puhuttelut voivat olla 
opettajan tai jonkun tuntemattoman puoleen kääntymistä. Kirjoittaja 
siis osannee ottaa huomioon kuvitteellisen lukijakunnan myös perintei- 
sessä koulukirjoittamisen kontekstissa. 

Vuoropuhelua lukijan kanssa rakennetaan paikoin suorasukaisesti: 
nyt asiaan; seuraavaksi tulee mieleen; aion nyt kirjoittaa siitä. Jo kuudes- 
luokkalaisilla on tekstin kulkua kommentoivaa, kertomustekstille tyypil- 
listä vuorovaikutuksen rakentamista: Mutta se siitä aiheesta, nyt asiaan! 
Keinoerot kuudes- ja yhdeksäsluokkalaisten välillä ovat kuitenkin ha- 
vaittavissa. Peruskoulun päättävä kommentoi tekstin rakennetta koko- 
naisvaltaisemmin kuin kuudesluokkalainen, ja kommentointiin liittyy 
evaluoivaa suhtautumista. Lukijaa johdatellaan huomaamaan kertova 
minä (esimerkki 7). 


7) Toisena tulee mieleen ystävät ja perhe hyvinvoivina tulevaisuudessa- 
kin. — — Seuraavaksi tulee unelmista mieleen urheilu. (9F16) 


Kertomuksen genressä lukijan huomioon ottava moniäänisyys liittyy 
etenkin orientaatioon, evaluointiin ja loppupäätelmiin (Labov 1972, 363). 
Aikuiskirjoittajilla kertomuksen orientaatio on tärkeä osa tekstiä. Sen 
tehtävänä on saada lukija tietoiseksi siitä, minkä vuoksi tarinan kerto- 
minen on perusteltua. Myös suomi toisena kielenä -ylioppilaskokeen 
kirjoitelmia tutkinut Komppa (2012, 58) toteaa, että orientointi on kirjoi- 
telmien kokonaisrakenteen kannalta keskeinen tekstinosien välinen 
suhde. Aloitus ja lopetus ovat useissa teksteissä konkreettisesti erotetta- 
vissa. Pääideana on tässä opiskelun vaiheessa tuoda esiin, mistä aiheesta 
ja mistä näkökulmasta kirjoitelmassa aihetta käsitellään. 
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Unelmakirjoitelmien aloituksissa lukijan huomioon ottaminen on 
useissa tapauksissa melko yksinkertaista tehtävänantoon viittaamista. Ei 
sanota, miksi kertoja haluaa kertoa tarinansa. Luodaan tarinamaailma, 
joka usein on minäkertojan kotiympäristö tai tuttu matkakohde tuttui- 
ne henkilöineen. Useassa kuudesluokkalaisten kirjoituksessa (8a—c) on 
kaavamainen Unelmieni päivänä heräsin -aloitus. Myös suuri osa yhdek- 
säsluokkalaisten kirjoituksista (8d—e) alkaa samansisältöisellä toteamuk- 
sella: 


8a) Unelmien päivä alkaisi Rauhallisella herätyksellä. (6M3) 

8b) Unelmieni päivä alkaisi alkaisi aamulla kun herään. (6M11) 

8c) Minun unelmienipäivä alkaisi aikaisella herätyksella. (6F5) 

8d) Minun unelmieni päivä alkaisi heräämällä Havajilaisesta hotellis- 
ta kaverini Paavon kanssa. (9M7) 

8e) Unelmieni päivä olisi sellainen että herään aamulla ja minua ei 
väsytä. (9M19) 


Tehtävänannon Unelmieni päivä mainitseminen tekstin alussa vaikuttaa 
kuitenkin olevan yritys asettaa oma teksti objektiksi ja päästä kirjoittami- 
sen alkuun. Aloitukset ovat kuitenkin yksiäänisiä, sillä niissä ei varsinai- 
sesti käännytä lukijan puoleen eikä tulla ulos kertomuksen maailmasta. 
Niissä ei siis tapahdu etäännyttämistä. Myös viides- ja seitsemäsluokka- 
laisilla suosituin tapa päästä tekstin alkuun on viitata annettuun aihee- 
seen: Nyt kerron unelmapäivästäni. Sen sijaan esimerkiksi seitsemäs- 
luokkalaisen tekstin keskeiseen sisältöön viittaava aloitusvirke Haluaisin 
yhden päivän ajaksi siivet edustaa harvinaisempaa aloitustapaa. (Sintonen 
2,011, 37.) 

Yhdeksäsluokkalaiset viittaavat kuudesluokkalaisia selkeämmin 
orientaatiossa siihen, mikä on tehnyt päivästä unelmien arvoisen, ja jat- 
kavat teeman syventämistä. Kuudesluokkalaisilla lukijan huomiointi on 
melko yksinkertaista (9), yhdeksäsluokkalaisilla on moninaisempia kei- 
noja ottaa lukija huomioon. He eivät toista tehtävänannon sanoja Unel- 
mieni päivä vaan lähestyvät kauempaa kertomuksen maailmaa (10-11). 
Kokeva minä tuodaan kertovan minän rinnalle ja pysäytetään kerronta 
aurinkoiseen aamuun, ja samalla tuodaan tekstin teema sisäisen minän 
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kautta lukijan tietoisuuteen (Tänään se tapahtuu; En voi uskoa tätä todek- 
si; Avaan verhot surullisina). 


9) Unelmieni päivä jonka toivoisin toteutuvan olisi se, että näkisin 
isäni jota en ole koskaan tavannut. (6F15). 

10) On aamu hotelli Presidentissä. Auringon säteet pyrkivät huonee- 
seeni sälekaihtimien väleistä. Olen juuri herännyt suureen päivään. 
Huonekaverini ovat jo ylhäällä. Tänään se tapahtuu, mistä olen aina 
haaveillut. Se on salibandyn MMfinaali. En voi uskoa tätä todeksi, 
mutta totta se on. Kotiyleisön edessä täydellä Hartwall areenalla, ja 
Ruotsi vastassa. Huippua! (9F12) 

11) Auringon säteet pääsevät läpi vaaleiden verhojen raosta ja raotan 
unenpöpperöisiä silmiäni, jotka juuri ja juuri aukeavat. Pyyhin naa- 
maani käsillä ja nousen hitaasti istumaan. Kävelen löntystellen ikku- 
nan ääreen. Avaan verhot surullisina. Unelmani on Amerikassa eikä 
kerrostalossa Suomessa. (9F23) 


Aloituksen lisäksi kertomuksen lopetus on kohta, jossa tyypillisesti 
käännytään lukijan puoleen ja asetetaan oma teksti objektiksi. Kuudes- 
luokkalaisten kirjoitelmissa lukee usein yksinkertaisesti Loppu tai nuk- 
kumaan menon toteamus Illalla tulin kotiin menin nukkumaan. Joissain 
kohdin kuitenkin palataan kertomuksen teemaan ja painotetaan, miksi 
kertomuksen esittäminen oli tärkeää (12-13), tai korostetaan omaa koke- 
musta (14): 


12) Unelmat olivat totta, Ja se johtui siitä että olin uskonut tosiunel- 
maan! (6F12) 

13) Ai niin, vielä yksi unelma jäi kertomatta/ oppia unelmoimaan len- 
tämisestä ja nälänhädän parantamisesta. Heh. (9F16) 

14) Olisi vain minä ja jää. (9F17) 


Yksi osa oman tekstin objektiksi asettamista on huomion kiinnittäminen 
omiin kielellisiin valintoihin. Kielen näkyviin asettaminen edellyttää kir- 
joittajalta tietynasteista metakielistä tietoisuutta (Herlin 2005; Niinimäki 
2015, 81). Unelmakirjoitelmista ei juurikaan löydy kuudesluokkalaisilta 
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tai yhdeksäsluokkalaisilta sellaisia konventionaalistuneita ilmauksia 
kuin nimitetään joksikin, voidaan sanoa, suoraan sanoen, toisin sanoen tai 
totta puhuen (ks. kuitenkin esimerkki 16: tarkemmin ajateltuna). Koulu- 
laisten kirjoituksissa metakielisyyttä on vain rajoitetusti ja rajoittunein 
keinoin toteutettuna. Useissa tapauksissa metakieleksi määrittäminen 
on tulkinnanvaraista, sillä nominaalilauseessa määritetään yhtä tarkoi- 
tetta, tehtävänannon lauseketta unelmieni päivää (15a—d)): 


15a) Minun unelmieni päivä olisi että saisin tehdä mitä haluan. 
(9F26) 

15b) Minun unelmien päivä on se, että pääsen kuuluisaksi. (6M2) 
15c) Unelmienipäivä olisi että voittaisin lotossa 10 miljoonaa euroa. 
(6M25) 

15d) Unelmieni päivä olisi sellainen että herään aamulla ja minua ei 
väsytä. (9F20) 


Esimerkeissä 15a—d ei ole tietoista kielen ilmauksen asettamista lukijan 
huomion kohteeksi, mutta jos tarkoitteen määrittelyä pidetään meta- 
kielisyytenä, näitä määrittelyitä voi pitää moniäänisinä. Tarkoitteiden 
määrittelyissä ei ole aikuisten teksteissäkään selvää rajaa sen suhteen, 
milloin on kyse kielellisestä selityksestä, milloin tarkoitteen kuvauksesta 
(Niinimäki 2015, 82). Jonkinlaista lausekkeen merkityksen esiin nosta- 
mista kuitenkin tehdään, kun käytetään ilmausta olisi että, on se että tai 
sellainen että. 

Myös kuudesluokkalaisten teksteistä löytyy ikäkaudelle ominaista sa- 
nojen merkitysten tarkastelua, joka parhaimmillaan on todellisuuteen 
viittaavaa pohdintaa (tarkemmin ajateltuna, 16). Nimittämiseen saattaa 
liittyä myös evaluointia (17). Voimakas nimitys — karjuja — yhdistetään 
äitiin ja lause rakennetaan niin, että huomio kiinnittyy juuri nimityksen 
valintaan. Tähdentäminen viittaa kertojan tietoisuuteen kielellisestä va- 
linnastaan. Kuudesluokkalaisten metakielisyys on tyypillisimmillään 
huomion kiinnittämistä kertomuksen maailman ihmisten ja eläinten 
nimiin. Lukija joutuu ulos tarinamaailmasta ainakin kohdissa ihmettelet- 
te varmaankin kaverini nimeä (18) sekä esimerkissä, jossa kertoja jää 
pohtimaan Lola-nimen antamista koiralle (19). Esimerkeissä liikutaan 
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kahdella tasolla, osittain lauseen merkitykseen liittyvällä, osittain mer- 
kitystä pohtivalla. 


16) Tarkemmin ajateltuna päivä on kovin lyhyt aika elää unelmaansa. 
(6F27) 

17) sittä se toinen karjuja, eli äiti, oli heittänyt itse kastellusta vessa- 
paperista tekemääni upeaa rekvisiittaa roskiin! (6F27) 

18) Oli sovittu, että tulisin mökille bussilla, sillä nuunuun* mökin vie- 
ressä oli bussipysäkki. ihmettelette varmaankin kaverini nimeä. Ei se 
ollut hänen nimensä mutta kaikki kutsuvat häntä sillä nimellä. (6F3:) 
19) Sillä aikaa kun koira nukkuu mietin, että minkä nimen annan 
sille. Päädyn kuitenkin antamaan sille nimeksi Lola. Mielestäni Lola 
sopisi täydellisesti nimeksi kauniille mustalle karvakasalle. (6F1:) 


Moniäänistä metatason pohdintaa on erityisesti niissä yhdeksäsluokka- 
laisten kertomuksissa, joissa kirjoittaja pohtii oman unelmapäivänsä 
merkitystä ja todellisuuspohjaa. Silloin puhuja kommentoi omaa puhet- 
taan ja suhteuttaa sanomaansa kulttuuria tai tekstuaalisia odotuksia 
vasten, minkä vuoksi ilmaukset voidaan nähdä moniäänisinä. Kehitty- 
neimpiä pohdintoja voi verrata aikuisten teksteissä esiintyvään meta- 
kielisyyteen. Sanataiteessa kieli nostetaan usein tarkkailun kohteeksi ja 
esimerkiksi Lauri Viidan Moreenissa kulkee näkyvästi taso, jolla kiinni- 
tetään huomio itse kieleen ja arvioidaan sen kykyä viitata todellisuuteen: 
Tuli kovasti yrittää, kilvoitella, kuten sanottiin, hyväksyä ehdot mitkä tahan- 
sa ja hävitä reilusti, kunniallisesti. (Viita 1973 [1950], 20). Esimerkeissä 
20-21 pysähdytään pohtimaan, mitä unelmat kertojalle merkitsevät ja 
millainen niiden todellisuusviittaavuus on. Käytetään ilmausta vaikea 
käsite, mikä viittaa selvästi kielelliseen pohdintaan. Moniäänisyys saa- 
daan molemmissa esimerkeissä aikaan myös viittaamalla muiden pu- 
heeseen (jotkut osaavat; hän kysyi minulta). Esimerkeissä kielen nosta- 
minen metatasolle näyttää suunnitellulta ja lukijan huomioon ottavalta: 


20) Unelmat ovat minulle hirvittävän vaikea käsite. Jotkut osaavat 
tarinoida sivutolkulla, kuinka haluaisivat osata lentää tai parantaa 


nälänhädän. (9F16) 
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21) Kesällä ollessani kaverini Karoliinan kanssa saaressa, hän kysyi 
minulta yhden kysymyksen: millainen sinun unelmiesi päivä olisi?” 
Totta puhuen, en tiennyt silloin yhtään minkälainen päivä se voisi olla. 
Kysyin saman kysymyksen häneltä ja vastaus jollakin lailla yllätti, kos- 
ka en ollut itse tullut ajatelleeksi asiaa siltä kannalta. (9M5) 


Tämän teoksen johdannossa viitataan paitsi oppilaiden erilaisiin kielelli- 
siin kykyihin ja valmiuksiin myös heidän erilaiseen motivaatioonsa 
tuottaa tekstiä ja uskoon omiin taitoihinsa eli niin sanottuun pystyvyys- 
uskoon. Kouluympäristössä oppilaat ovat kirjoitustilanteessa mukana 
sosiaalisessa prosessissa ja heillä on omassa yhteisössään erilaisia roo- 
leja, joiden taustalla on erilaisia arvoja, ideologioita ja identiteettejä (vrt. 
Heikkinen & Voutilainen 2012, 17). Myös opetukselliset seikat vaikut- 
tavat tulokseen. Koululla onkin vastuu tasoittaa paitsi kielellisten val- 
miuksien eroja myös niitä eroja, joiden taustalla ovat edellä mainitut 
arvoihin ja identiteettiin liittyvät ennakkoluulot. Seuraava esimerkki 22 
on osoitus kirjoittajansa taidoista ja korkeasta motivaatiosta. Siinä on 
niin kehittynyttä metakielen käyttöä, että syntyy vaikutelma suunnitel- 
lusta retorisesta kuviosta. Kirjoittaja käyttää ajanmääritteiden toistoa ko- 
hosteisesti, ja lukija havaitsee nämä merkitykset. Yhdeksäsluokkalaisen 
tekstissä voidaan puhua myös metafiktiosta, sillä siinä tietoinen toisto 
viittaa kirjoittamisen hetkeen mutta on osa fiktion maailman tapahtu- 
mia, eikä lukija joudu ulos tästä maailmasta: 


22) Herään, ja kerrankin väsymys on poissa. Fi sitä uuvuttavaa tah- 
meutta, kaikennielevää toivottomuutta, yllä leijailevaa ukkospilveä. 
Kerrankin voin vain huoletta nousta, leijailla ajatuksiini uppoutuneena 
ympäri asuntoa. Ei kiirettä, turhautumista, ei ketään tyrmäämässä 
sanoillaan. — — Sinä päivänä annoin itseni uskaltaa. Ehkä huomenna 


55 Lyriikkaan liitettävällä metafiktion käsitteellä (Hallila 2006) viitataan kirjoittamisen hetkeen, kirjoittami- 
seen ja kertomisen aktiin. Käsitteen avulla voidaan valottaa myös koululaiskertomuksen kirjoittamisen 
aktia. Metafiktio on metatasoisuudestaan huolimatta fiktion sisässä esitettyä, osa fiktiivistä maailmaa. 
Tässä määritelmässä vertailtavuus koululaisteksteihin liittyy kirjoitushetkeen ja kirjoittamisen aktiin 
viittaamiseen. 
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kaikki on taas loisin, ehkä huomenna ahdistus palaa. Ehkä huomenna 
hallitsee taas pelko ja linnut putoavat taivaalta ja skeittini jää huoneen 
nurkkaan, ehkä huomenna kasvoilta paistaa pettymys. Ehkä huomen- 
na, muttei tänään. (9M6) 


Puheen ja ajatusten referointi 


Aikaisempaan puheeseen tai ajatteluun viittaaminen, referoinnin eri 
tavat, tuovat tekstiin useissa tapauksissa selkeästi erotettavan moniääni- 
syyden tason. Referointikeinot muodostavat jatkumon suorasta esityk- 
sestä epäsuoraan esitykseen, puheaktin ilmaisemiseen ja kerrontaan. 
Jatkumoa on käsitelty niin suomen kielen tutkimuksessa (esimerkiksi 
Penttilä 1957; Ikola 1961; Kuiri 1984; Hakulinen ja muut 2004; Kallio- 
koski 2005a.) kuin kansainvälisessä kirjallisuudessa (esimerkiksi Nord- 
gvist 2001, Köder 2016). Erityisesti kehityksellisessä kontekstissa on 
tyypillistä, että erot eivät ole kaikilta osin selvät. 

Unelma-aineisto osoittaa, että niin alakoululaisten kuin kuudes- 
luokkalaisten ja yhdeksäsluokkalaisten referoinnin tavoissa, määrässä 
sekä muusta tekstistä erottamisessa on selviä eroja ikäryhmien välillä. 
Tarkastelen referointia niin kieliopin kuin tekstilajin sekä tekstin sisäl- 
tämien erilaisten näkökulmien ja vaihtoehtoisten tulkintojen kannalta 
(vrt. Kalliokoski 2005a, 36.) Tulkinnat liittyvät nimenomaan siihen, mitä 
merkityksiä lukija liittää referoinnin kautta tuotuihin toisiin ääniin, eli 
miten referointi ohjaa lukijan tulkintaa (vrt. Virtanen, Rahtu & Shore 
2018, 19-20). 


SUORA ESITYS — PUHEEN REFEROINTIA 

Suorilla sitaateilla on eri tekstilajeissa erilaisia funktioita, mutta yhteistä 
on, että niiden kautta voidaan välittää lukijalle sellaisia henkilön puheen 
piirteitä, joita eivät epäsuora esitys tai vapaa epäsuora esitys välitä, esi- 
merkiksi imperatiivimuotoisuus, puhuttelut ja partikkelien käyttö (Ha- 
kulinen ja muut 2004, 1401-1402; Kuiri 1984). Samoin voidaan suoraan 
tuoda ilmi tilannesidonnaisia ja affektiivisia piirteitä sekä murteellisuuk- 
sia. Suorassa esityksessä referoija periaatteessa toistaa sen, mitä toinen 
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henkilö sanoi, ja myös sen, miten hän sanoi tai ajatteli. Yhdeksi suoran 
esityksen keskeiseksi funktioksi kertovassa tekstissä nousee henkilöiden 
idiolektin esittäminen ja sen myötä henkilökuvien rakentaminen. 
Ensimmäisen luokan aineistossa ei ole vielä yhtään suoraa esitystä, 
mutta käyttö kasvaa kehityksellisesti. Kuudesluokkalaisilla5* suora esitys 
on melko yleisesti käytössä (32 prosentilla aineistoni kirjoittajista, tytöis- 
tä jonkin verran useammalla kuin pojista), mutta on vaikea tietää, kuin- 
ka moni kuudesluokkalainen kirjoittaja välttää referointia harjaantu- 
mattomuuttaan. Kuitenkin suuri osa niistä, jotka referointia käyttävät, 
on jollain tavoin tietoinen puheen erottamisen keinoista. Seuraavassa 
esimerkissä 23 kuudesluokkalaisen kirjoitelmassa käytetään dialogia 
kerronnan keinona niin, että dialogilla on myös kerronnan pysäyttävä, 
puhujia luonnehtiva funktio. Tyttöjen epäröinti ja herra Koskisen ystä- 
vällisyys paljastuvat repliikeistä, jotka eivät ole pelkästään tapahtumia 
eteenpäin vievässä tehtävässä. Kirjoittaja osaa erottaa vieraan puheen 
kerronnasta ja käyttää välimerkkejä normien mukaisella tavalla: 


23) Avasimme oven numero 1. Sisällä oli kokonainen kylpylä, ja kaveri- 
ni kysyi minulta: ”Onkohan järkevää mennä sisään? Emmehän tiedä 
edes kuka on kuski!” ”No, selvitetään asia.”, sanoin. Huusimme kuskia, 
ja ovesta 3 tuli ulos kiltin näköinen mies. Hän sanoi: ”Herra Koskinen, 
palveluksessanne neidit. Saatte tehdä täällä ihan mitä haluatte. Tämä 
limusiini on nyt omistuksessanne.” ”Voi kiitos!” sanoimme yhteen ää- 
neen. Meistä ja Herra Koskisesta tuli hyviä ystävyksiä. (6F4) 


Toisessa kuudesluokkalaisen kirjoitelmassa (esimerkki 24) rajataan re- 
feraatti johtoilmauksen avulla, mutta suoran esityksen välimerkit puut- 
tuvat eikä virkerajoja ole merkitty. Oma ja lainattu puhe eivät erotu. Kir- 
joittaja luonnehtii henkilöitä puhekielisin repliikein: huolehtivainen äiti 
ja innokas pikkupoika. 


56 Muhosen (2019, 27—29) mukaan vuosien 2006 ja 2014 kuudesluokkalaisilla suora esitys kasvaa ker- 
tomusrakenteen hallinnan myötä. Kertovia kirjoitelmia on aineistossa 187 ja niissä on yhteensä 120 
suoraa esitystä, epäsuoran esityksen määrä on selvästi vähäisempi. Yhteensä kuudennen kirjoitelmia 
on 320. 


MONIÄÄNISYYDEN ILMAISUN KEHITTYMINEN PERUSKOULUN PÄÄTTÖVAIHEIDEN ... 225 


https://doi.org/10.21435/skst.1472 


24) Silloin kun Pikku-Anssi oli syönyt jäätelön hän sanoi äidilleen 
Haluan särkänniemeen. Äiti vastasi okei kulta mutta ensin haemme 
siskosi ja isoveljesi mukaan. ja isäsi silloin Anssi Hyppäsi ilmaan ja 
huusi jippiiii! (6M21) 


Pajunen (2012, 26) toteaa, että monet alaluokkien kirjoittajat vuoden 
2006 Unelmakirjoitelmissa käyttävät vuoropuhelua vain kerrontaa 
eteen päin vievänä keinona. Muhosen (2019) mukaan tämä on vielä 
yleisempää vuoden 2014 aineistossa. Tällöin suora esitys harvoin kuvai- 
lee referoitavaa. Vuoden 2014 Unelmakirjoitelmissa kerronta etenee 
lyhyin vuoroin: Hän kysyi äidiltä tuletko kanssani tee kuppeihin? Äiti 
vastasi okei! Sitten veli kysyi Hei Anssi tuletko kummitusjunaan Anssi ei 
uskaltanut sillä siellä oli pimeää (6M21). Referoinnin keskeinen funktio 
narratiivissa onkin luonnollisesti juonen eteen päin kuljettaminen (ks. 
esimerkiksi Berman 2004) mutta suoran esityksen dialogimainen ket- 
jutus tekee tekstistä raskasta. Kirjoitetun kielen osalta ei kuitenkaan ole 
selviä sääntöjä siitä, milloin käyttää suoraa milloin epäsuoraa esitystä ja 
kuinka paljon niitä kulloinkin kannattaa käyttää; kehityksellisesti suoran 
esityksen käyttäminen kirjoitetussa kielessä kuitenkin vähenee. Kuu- 
dennen luokan pojilla epäsuora esitystapa on jo hieman yleisempi kuin 
suora, tytöillä on päinvastoin. Ammattikorkeakoululaisten Unelma- 
kirjoitelmissa on virkkeenkaltaisia T-yksikköjä kaikkiaan lähes 4 000, 
niistä 1,6 prosentissa on suoraa esitystä ja 6,1 prosentissa epäsuoraa 
(Tiiro 2021). Puhutussa kielessä suora esitys voi lisääntyäkin ja silloin 
sen kuvailevuutta väritetään multimodaalisin keinoin. 

Useissa kuudesluokkalaisten teksteissä suoraa esitystä ei rajata sel- 
keästi kertomuksessa omaksi moniäänisyyttä tuottavaksi jaksokseen. 
Esimerkissä 25 kuudesluokkalainen tyttö perustelee kirjoitelmansa 
orientaatiossa miksi esittää kertomuksensa ja kuvailee lauantaiaamun 
väsyneen tunnelman ja syntymäpäiväkoristelun yksityiskohtia mutta ei 


57 Epäsuoran esityksen määrää on aikuiskirjoittajien omaelämäkerrallisissa tarinoissa aika vaikea ar- 
vioida, koska ne on usein kirjoitettu kokonaan kokemuksellisesta näkökulmasta. Prosentti voisi olla 
huomattavastikin korkeampi, jos mukaan laskettaisiin erilaiset tuntemuksien tms. ilmaisut. Annettu 
prosentti on laskettu epäsuoran esityksen kehyslauseiden avulla. 
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erota orientaatiota muusta tekstistä eikä muitakaan kerronnan uusia 
näkökulmia. Hän kirjoittaa moniäänistä tekstiä, jossa tulevat esiin kerto- 
jan omat tuntemukset sekä perheenjäsenten repliikit, mutta hän ei rajaa 
puheenvuoroja eikä luo tekstiinsä koherenssia (vrt. Kalliokoski 2005b, 
225). Kirjoittaja ei siis paljoakaan opasta lukijaa moniäänisyyden tulkin- 
nassa. 


25) Heräsin varhain lauantai aamuna. Nousin sängystä väsyneesti. 
Laahustin keittiöön. Wwow! Lamppuihin oli ripustettu serpenttiiniä, 
pöydällä oli valtava kakku jossa oli kaksitoista kynttilää, sekä pöydällä 
oli paljon muitakin herkkuja. Tuoleista riippui ilmapalloja. Mutta mik- 
si tämä kaikki? Hyvää syntymäpäivää! Havahduin. Aivan, tänään oli 
minun syntymäpäiväni! Paikalla oli veljeni, vanhempani, sukulaiseni 
ja kaverini kaikkilla leveä hymy kasvoillaan. Istu pöytää! äiti sanoi. Pu- 
halsin kynttilät, söin kakkua, sekä mutustin karkkia. Aika kiva aamu- 
pala, ajattelin. Paljon onneeaaa vaan, paljon onneeaaa vaan raikui. 
”Aamiaisen” jälkeen puin vaatteet päälle ja tein muut aamupuuhat. 
Äiti sanoi: viemme sinut syntymäpäiväsi kunniaksi Fun Parkkiin. 
Jeeeeeeeeeeeee! huusin. (GF15) 


Kuudesluokkalaisilla leksikaalinen variaatio on kehystävissä johtolau- 
seissa usein vielä vähäistä. Koko alakoulun aineistossa on yleistä käyttää 
sanoa-verbiä puheenvuoron merkkinä tai puheenomaisesti, vaikka kysyä, 
vastata tai jokin merkitykseltään spesifisempi verbi olisi odotuksenmu- 
kaisempi (vrt. Pajunen 2012, 25.) Kehityksellinen ero näkyy hyvin, jos ver- 
rataan yksittäisten puheaktiverbien keskimääräisiä esiintymiä Unelma- 
kirjoitelmissa. Alakoulun luokilla 1.-5. esiintymiä on yhdellä puheakti- 
lekseemillä keskimäärin lähes kymmenen ja kuudennella luokalla yh- 
deksän mutta yläkoulussa ja aikuisilla määrä putoaa kuuden paikkeille: 
leksikaalinen variaatio siis lisääntyy. Vastaavasti kaikista verbiesiintymis- 
tä puheaktiverbien osuus lähes kaksinkertaistuu alakoulusta aikuisiin. 
Toisin sanoen illokutiivisten sävyjen ilmaisumahdollisuudet kasvavat 
selvästi iän mukaan. Samanlaisen kehityksen toteavat myös Nordgvist 
(2001) ja Köder (2016). Esimerkissä 26 kuudesluokkalaisen pojan teks- 
tissä sanoa toistuu johtolauseen verbinä. Kerronta etenee vuoropuhelu- 
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na. Kirjoittaja rajaa referaatin johtoilmauksen sekä kaksoispisteen avulla 


mutta muuten välimerkkejä ja isoja kirjaimia käytetään säästeliäästi. 


26) Hän luuli, että olisin karannut tai minut olisi siepattu. sanoin 
äidille: tule hakemaan mut täältä K-City-marketi pihasta. äiti sanoi: 
tulen ja sitten saat siivota. nähdään kohta. Viiden minuutin kuluttua 
tuttu Nissan tuli. Menin kyytiin. Äitini sanoi älä sitten ikinä tee tuol- 
laista. Mutta sanoin: ME VOITIMME 50 MILJOONAA EUROA. 
Äiti sanoi, että höpöhöpö Näytin Sekkiä äidille. äiti meinasi ajaa 
ojaan, kun näki sekin. sanoin, että nyt olemme rikkaita, mutta pyörä- 
ni varastettiin. Äidin hymy ei kuitenkaan hyytynyt. Hän sanoi: Entä 
sitten olemme rikkaita. (6M17) 


Esimerkissä 27 kuudesluokkalainen tyttö sen sijaan taitaa välimerkit 
suoraa esitystä käyttäessään. Suora esitys keskeyttää kerronnan ja johto- 
lauseen verbi huikata kuvaa hyvin kohteena olevaa henkilöä. Lisäksi 
kirjoittaja luottaa lukijan kykyyn tehdä päätelmiä. Tässä tapauksessa 
kirjoittaja pystyy etäännyttämään tekstin itsestään ja teksti on aidosti 
moniäänistä. 


27) Kopissa istuvat kaikki vanhat kaverit omilla vakipaikoillaan. Essi 
katsahtaa jäälle ja huikkaa: ”Meillä on sitten Susanna. Vauhtia!” 
Kaikki kaivavat nenäliinat äkkiä treenilaukuistaan ja kiiruhtavat yh- 
dessä jäälle. (OF 13) 


Suoran esityksen käyttö vähenee huomattavasti peruskoulun päättövai- 
heeseen edettäessä. Yhdeksäsluokkalaisten kertomuksista suora esitys 
on lähestulkoon kadonnut, sillä vain vajaa kymmenes osa aineistoni 
kirjoittajista referoi puhetta suorana esityksenä. Keskusteluun viitataan 
useasti vain puheaktin tiivistelmällä kuten esimerkeissä 28a ja b. 


28a) Puhun mahdollisimman hyvää Amerikkaa ja kerron osoitteen ja 


lähdemme matkanpäähämme. (9F23) 
28b) Kertoisimme itsestämme ja Suomesta jotain. (9F26) 
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Ne harvat yhdeksäsluokkalaiset, jotka käyttävät suoraa esitystä, yleensä 
osaavat tuoda toisen äänen tekstiin, arvottaa omaa puhettaan ja referoida 
myös ajatuksiaan. He osaavat ottaa aikaisemmat puheenvuorot tarkoi- 
tuksenmukaisesti oman kertomuksensa osaksi. Kirjoitelmassa 29 toi- 
nen ääni tuo vieraan henkilön näkökulman, jonka avulla kertoja arvot- 
taa asioita. Esimerkin 30 kirjoittaja pysäyttää kerronnan dialogin avulla. 
Hän varioi myös puheaktiverbiä tarkoituksenmukaisesti ja käyttää pu- 
hetta erottavia välimerkkejä melko virheettömästi. Kolmannen esimer- 
kin 31 kirjoittaja tietää, että suorana esityksenä voi referoida myös omia 
ajatuksiaan: 


29) ”Unelmeni päivään kuuluisi se, että minulla olisi niin paljon ra- 
haa, että voisin maksaa kaikki perheeni velat pois,” Karoliina kertoi. 
Sen jälkeen omat unelmieni päivän aiheet tuntuivat todella itsekkäiltä. 
(9M5) 

30) ”Oletko pakannut matkalaukkusi” huutaa äiti samalla kun kävelee 
vessan ohi missä olen pesemässä hampaitani. ”Joo joo” yritän sanoa sel- 
västi mutta suuni oli täynnä hammastahnaa. — — ”Olemme jonottaneet 
jo yli puoli tuntia” huokaisin. Kunnes jono alkoi liikkua, huokailuni 
loppui. (9F11) 

31) En saanut muita sanoja suustani kuin ”kiitos” ”Mutta kiitoshan oli 
juuri sopiva sana”, mietin. (9F11) 


Suoran esityksen käytön väheneminen vastaa tarkoin monista muista 
kielistä esitettyä kehitystä (vrt. Goodell & Sachs 1992; Nordqvist 2001; 
Köder 2016). Ilmiö selitetään usein viittaamalla referoinnin keinojen 
epälineaariseen kehitykseen: alakouluikäiset ja nuoret aikuiset käyttävät 
paljon suoraa esitystä — vaikka eri tavoin —, murrosikäiset tukeutuvat 
epäsuoraan esitykseen. Väite ei toteudu aikuisten Unelmakirjoitelmista, 
mutta ero voi johtua aiheesta ja siitä, että kerronta painottuu kokemuk- 
sellisesti. Nordgvistin aineisto on kuvaelisitaation avulla tuotettua sam- 
makkotarinaa, jossa kerronta etenee etsintäteemana ja etsinnän aikana 
kohdataan useita eläimiä: ruotsalaiset aikuiskoehenkilöt ilmaisevat näitä 
kohtaamisia sekä pojan että eläinten fiktiivisten repliikkien suorana esi- 
tyksenä. Suomen aineistossa sammakkotarina kirvoitti vain puhutussa 
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versiossa suoraa esitystä mutta ei lainkaan kirjoittamalla tuotetussa 
(sammakkotarinoista ks. johdantolukua). On vaikea sanoa, mistä ero 
johtuu. Myös aikuisten Unelmakirjoitelmissa suora esitys on lähes ole- 
matonta, kuten jo todettiin. 


EPÄSUORA ESITYS — PUHEEN JA AJATUSTEN REFEROINTIA 

Suora ja epäsuora esitys ovat keskeisiä referoinnin pääluokkia (oratio 
directa ja oratio obliqua) (ks. Evans 2012). Suorassa esityksessä (Haku- 
linen ja muut 2004, 1406-1407) referaattiosan keskus on representoi- 
dussa tilanteessa, epäsuorassa esityksessä puhehetken aikaisessa tilan- 
teessa, jolloin asiaan otetaan etäisyyttä kerrontahetken perspektiivistä. 
Puhuja ja puhetilanne ratkaisevat, millaisen muodon lause saa. Refe- 
roinnin keinojen esittäminen jatkumona (esimerkiksi Hakulinen ja 
muut 2004, 1400; Leech & Short 1981, 324; Evans 2012) perustuu ker- 
tojan kielellisen osuuden määrään, joka lisääntyy asteittain suorasta esi- 
tyksestä epäsuoraan ja referoinnin muihin muotoihin. 

Syntaktisesti suoran ja epäsuoran esityksen eroa luonnehditaan niin, 
että suorassa esityksessä lauseiden suhde on rinnastussuhde, epäsuoras- 
sa esityksessä alistussuhde. Varsinkaan aikuisten sanataiteen kertomuk- 
sissa referointikeinojen rajat eivät ole kategorisia, vaan ne on häivytetty 
ilmeisen tarkoituksellisesti. Samoin raja rinnasteisuuden ja alisteisuu- 
den välillä on hämärtynyt. Tapauksia voi verrata puhutun kielen refe- 
rointiin, jossa ero suoran ja epäsuoran esityksen välillä katoaa. (Vrt. 
Niinimäki 2015, 142-148.) Neutraaleiksi luonnehdituissa tapauksissa 
muodon ja sisällön distinktio katoaa. Tällöin että-konjunktio ei ilmaise 
alisteisuutta vaan tekstuaalista sidoksisuutta johtolauseen ja referaatin 
välillä ja vastaa näin-sanan käyttöä: Hän sanoi NÄIN, pula on aina läsnä 
——. (Kuiri 1984, 98.) 

Peruskoulun ylemmillä luokilla epäsuora esitys lisääntyy suhteessa 
suoraan esitykseen. Samoin merkitykseltään kompleksisten puheakti- 
verbien käyttö lisääntyy, kuten todettiin edellä. Kuudesluokkalaisilla 
että-lauseella alistettua epäsuoraa esitystä on noin puolella kirjoittajista, 
tosin koko kuudennen aineistossa jonkin verran vähemmän. Yhdeksäs- 


58 Aikuiskoehenkilöiden määrä Unelma- ja sammakkoaineistossa on yhteensä lähes 400. 
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luokkalaisten kertomuksissa epäsuoraa esitystä on yli puolella kirjoitta- 
jista, siis selkeästi useammalla kuin suoraa esitystä? 

Tarkastelen epäsuoraa esitystä siltä kannalta, miten sen avulla tuo- 
daan tekstiin muita ääniä ja samalla tarkastelen myös, missä funktioissa 
epäsuora esitys koululaisten teksteissä on: referatiivisena, kirjoituksen 
etenemiseen vaikuttavana, vai episteemisenä, tekstin dialogisen tilan 
(= mukana vähintään kaksi ääntä tai näkökulmaa) säätelyyn liittyvänä 
(vrt. Virtanen & Juvonen 2018, 191 blogikirjoittamisen vuorovaikutuk- 
sesta). Epäsuorassa esityksessä äänet ovat joko kertojan oman puheen tai 
muun henkilön puheen tuottamia toisia ääniä tai minäkertojan omien 
aiempien ajatusten esille tuomista (Virtanen & Juvonen 2018, 185). 
Myös koululaisten teksteissä epäsuora esitys todentuu referaatteina, 
joissa puhuja referoi joko puhetta tai omia ajatuksiaan, kokemuksiaan 
ja tuntemuksiaan. Koska koululaisten tekstit ovat minämuotoisia, niissä 
esitetty ajatusten referointi on pelkästään omien ajatusten esittämistä 
(muutamassa tapauksessa on me-muoto). 

Tapaukset poikkeavat toisistaan kerrontastrategiassa niin, että puhe- 
aktiverbiä käytettäessä referointi on tyypillisesti tarinaa kuljettavassa teh- 
tävässä, mutta ajatuksia ja kokemuksia referoitaessa puhuja pysäyttää 
kerronnan ja tuo esiin kokevan minän. Kuudesluokkalaisten epäsuora 
esitys (esimerkit 32-33) on huomattavasti enemmän puheen referointia 
kuin yhdeksäsluokkalaisten, joilla epäsuora referointi painottuu ajatus- 
ten, kokemusten ja tuntemusten esittämiseen. Kuudes- ja yhdeksäsluok- 
kalaisten Unelmakirjoitelmissa epäsuora esitys noudattaa vain harvoin 
niitä normeja, joilla kirjoitetun tekstin referaattia ohjeistetaan muut- 
tamaan meneillään olevan puhetilanteen mukaiseksi. Koko alakoulun 
aikana että-lause toteutuu usein sekaesityksenä, jota on käytetty aiem- 
min myös vapaan epäsuoran esityksen nimityksenä (Hakulinen ja muut 
2004, 1405-1406, 1413-1414). 

Tarkastelen ensin sellaista epäsuoraa esitystä, jossa alisteisessa lau- 
seessa referoidaan puhetta. Esimerkissä 32 kertoja tuo tekstiin toisen 


59 En käsittele erikseen tapauksia, joissa kirjoittaja käyttää lauseenvastikerakennetta, koska niitä esiintyy 
vain satunnaisesti: Nousin sängystä ja puin vaatteet päälleni kävelin kohti keittiötä jossa oli lappu jossa 
äiti kertoi lähteneensä ylitöihin ja että pöydällä olevan pitsan sai syödä (6M18). 
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äänen, ja esimerkissä 33 kertoja referoi omaa aikaisempaa puhettaan. 
Kumpikaan kirjoittaja ei muuta repliikin aikamuotoa tai modusta (oi- 
keammin lähdettäisiin) eikä ajanmääritteitä (nyt; tänään) kerrontahetken 
mukaiseksi. On aika yleistä, että deiktisistä kategorioista juuri tempus 
jää muuntamatta (Evans 2012). Myös yhdeksäsluokkalaisilla epäsuoran 
esityksen aikamuotojen ja muiden deiktisten elementtien muuttaminen 
puhehetken mukaisiksi vaihtelee. Esimerkissä 34 kirjoittaja tuo tarinaan 
uusia ääniä kertojan äänen rinnalle, mutta referointi on funktioltaan 
pääosin tarinan kuljettamista eikä kerronnan pysäyttämistä tapahdu. 
Kirjoittaja ei etäännytä kerrontaa itsestään, ei siirrä deiktistä keskusta 
tapahtumahetkestä puhehetkeen eikä muuta persoonapronomineja tai 
deiktisiä elementtejä puhetilanteen mukaisiksi (täällä; meneppä). Lisäksi 
puhekielinen että-konjunktio on kysymyslauseen alussa. 


32) Minä lähdin kotiin, mutta kun olin kotona äiti sanoi, että nyt 
lähdetään Eedenii (kylpylään). (6F9) 

33) Myöhemmin aamupäivällä soitin kaverilleni, ja kyselin, että voisi- 
kohan hän tulla tänään kanssani kaupunkiin. (6F4) 

34) Mies kysyi, että mitä me täällä teemme Sanoimme, että tulemme 
pelastamaan eläimet Mutta sitten mies sillä hetkellä soitti poliisit. kun 
poliisit tuli paikalle he kysyivät, että mikä nyt on ongelmana. Sanoim- 
me, että meneppä katsomaan tuonne sisälle miten eläimet kärsivät. 
— — Poliisi sanoivat meille, että saatte viedä kaikki eläimet ja hoitaa ne 
kuntoon. (9F25) 


Edelliset sekaesityksenä referoidut kohdat voi rinnastaa puhutun kie- 
len referointiin, jossa ero suoran ja epäsuoran esityksen välillä katoaa. 
Vaikka koululaiskirjoittaja ei ottaisikaan referaatin funktiota huomioon, 
hän kuitenkin toteuttaa edellisenlaisissa tapauksissa suoran esityksen 
funktiota luonnehtia repliikillä puhujaa, kuten poliisia (että mikä nyt on 
ongelmana) tai nuoria tyttöjä (meneppä katsomaan tuonne sisälle). Sekaesi- 
tyksen näkemystä tukee myös että-konjunktion olemassaolo melkein 
poikkeuksetta epäsuoran kysymyksen alussa. Samoin tapahtumahetken 
tuominen puhehetken osaksi sekaesityksenä on luontevaa, vaikka se on 
oikeinkirjoituskäytänteiden vastaista. Voikin todeta, että vaikka kirjoitta- 
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jat eivät tukeudu normeihin, he osaavat tuoda toisen äänen tekstiinsä. 
Myös aikuisten sanataiteilijoiden kertomuksissa on usein tarkoitukselli- 
sesti sekaesityksen piirteitä. Varsinkin vapaan epäsuoran esityksen kaut- 
ta saadaan henkilön ääni kuuluviin kertojan äänen rinnalla. 

Kirjoittajat tuovat toisinaan esiin myös tiedollisen arvionsa referoidus- 
ta asiantilasta. Kertoja tietää asiantilan (37), luulee asiantilasta jotain (35) 
tai vain ilmaisee ajattelevansa asiantilaa (36). Esimerkkitapauksissa kir- 
joittaja jäsentää kehyslauseen avulla tekstiä ja ottaa lukijan huomioon. 
Ajatuksen samoin kuin puheen referointi tapahtuu sekaesityksenä, ja 
tapahtumahetki on läsnä esimerkiksi ilmauksissa tästä päivästä tulee (36) 
sekä tästä (37): 


35) aluksi luulin että se oli isoveljeni tekemä pila. (6M5) 

36) Heräsin aamulla ja ajattelin, että tästä päivästä tulee kaikkein pa- 
ras päivä. (GF 4) 

37) Heräsin virkeämpänä ja tiesin että tästä tulisi hyvä päivä. (9M12) 


Juvonen (2014, 59) toteaa lukioikäisten kirjoittajien yhdyslauseiden 
tietää-rakenteista, että niiden käyttämisessä on kyse lukijan odotusten 
herättämisestä tekstin etenemisen suhteen. Tällöin lukijan rooliksi 
hahmottuu havainnoida tekijän ajattelua eikä osallistua siihen. Juvosen 
mukaan kyse on usein toistuvasta ja kiteytyneestä tavasta osoittaa asen- 
noituminen puheenalaiseen asiaan, jäsentää vuorovaikutusta ja ylläpitää 
suhdetta vastaanottajaan tai puhekumppaniin. Peruskoululaisten teks- 
teissä rakenteita tiesin että, luulin että ja huomasin että käytetään vastaa- 
vissa funktioissa. Kyse on paitsi tekstinsisäisestä viittaamisesta myös 
oman tekstin jäsentämisestä ja lukijan huomioon ottamisesta eli tekstin- 
ulkoisesta moniäänisyydestä. 

Joskus kirjoittaja juuttuu korostamaan kerrontaansa ja käyttää ajatus- 
ta, havaintoa tai kokemusta ilmaisevaa verbiä toistuvasti. Esimerkeissä 
38a ja 38b kirjoittajat pitävät puhehetkeä ja kertovaa minää korostetusti 
esillä toistamalla huomata-verbiä. Toisto voi olla joko taitamattomuutta 
tai tietoista retorisen keinon käyttöä. 
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38a) Mutta hetken päästä huomasin etten ollut kotona. Huomasin mi- 
nulla olevan mustan hatun, sinisen viitan ja valkoiset vaatteet. (6M1:) 
38b) huomaan, että Äitini on käynyt kaupassa — — ja huomaa, että ka- 
verini ei ole vielä herännyt — — huomaan, että kylässäni (siinä pelissä) 
on ruoka loppu — — joten päätän lopettaa pelin ottaeni huomioon „että 
metripitsä näyttääkin olevan valmis äitini mukaan. (9M13) 


Kuudesluokkalaisilla tämäntapainen referointi liittyy tilanteeseen, ei esi- 
merkiksi yleiseen pohdintaan, yleisiin normeihin tai aikaisempiin tapah- 
tumiin. Funktio on tyypillisesti kerronnallinen. Yhdeksäsluokkalaisilla 
taas funktiona on episteemisen modaalisuuden mukaan tuominen, ku- 
ten esimerkissä 38b, jossa kirjoittaja välittää minäkertojan ajatuksia ja 
tuntemuksia ilmauksin tietää että, huomata että, ajatella että ja toivoa 
että. 


VAPAATA EPÄSUORAA ESITYSTÄ JA TAJUNNANVIRTAA 
Vapaa epäsuora esitys tuo tekstiin moniäänisyyden, sillä siinä yhdisty- 
vät sekä kertojan että referoitavan henkilön näkökulmat ja sanamuodot. 
Deiktiset elementit voivat olla kerrontatilanteen mukaiset mutta sana- 
valinnat aikaisemman puhetilanteen ja alkuperäisen puhujan valintoja 
(ks. Hakulinen ja muut 2004, 198-200.) Kielellisistä seikoista voi päätel- 
lä, kuinka kokonaisvaltaisesti kertoja ottaa toisen äänen mukaan. Vaikka 
esitystapaa käyttävät pääosin osaavat aikuiskirjoittajat, saman tapaista 
referointikeinoa käyttävät jonkin verran myös varsinkin kehittyneet yh- 
deksäsluokkalaiset. Myös kuudesluokkalaisten kirjoitelmissa kuvaillaan 
omia ajatuksia, ja yhteys vapaan epäsuoran esityksen kaksiäänisyyteen 
löytyy usein siitä, että kertovan minän ääni yhdistyy kerrottuun minään. 
Esimerkin 39 kuudesluokkalaisen teksti on monin tavoin moniääni- 
nen. Aluksi tuodaan esiin vieras ääni epäsuorana esityksenä (sain kuulla 
että), minkä jälkeen kertovan minän ääni yhtyy kerrottuun minään. Näin 
kertoja tuo ilmi tietonsa tulevasta pelistä. 


39) Samalla sain kuulla että Valmentajat valitsivat minut maajouk- 
kueeseen. Ensimmäinen peli on kuukauden päästä Espanjaa vastaan. 


(6M19) 
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Esimerkissä 40 kertoja toteaa kertovana minänä aikaisen aamuherätyk- 
sensä mutta tekee sen jälkeen näkökulman vaihdoksen kokevaan mi- 
nään: Tänään on minun syntymäpäiväni. Tulkitsen mietteen vapaaksi 
epäsuoraksi esitykseksi. Sen jälkeen kerronta jatkuu kellonajan toteami- 
sella. 


40) Heräsin aikaisin aamulla. Tänään on minun syntymäpäiväni. 
Katsoin kelloa ja se oli 7.05. (6M22) 


Minäkertoja esimerkissä 41 tuo kaverin äidin äänen mukaan vapaana 
epäsuorana esityksenä referaatilla Vasikka oli karannut ja siirtyy sen 
jälkeen toiminnan kuvaukseen. Pluskvamperfekti oli karannut viittaa 
toiselta saatuun tietoon, johon kertoja tukeutuu. Esimerkissä 42 vaarin 
ääni tulee yhdeksäsluokkalaisen kertomuksessa esiin minäkertojan pu- 
heen lomassa. Konditionaali on osoitus kertojan ja vaarin näkökulmien 
limittymisestä. Kertoja tuo konditionaalin kautta esiin epäröivän suhtau- 
tumisensa vaarin aikeisiin (Hakulinen ja muut 2004, 1412—1413). 


41) Keskellä yötä Tomin äiti huutaa meitä. Vasikka oli karannut, 
etsimme kaikkialta, mutta vasikkaa ei löytynyt. (9M8) 

42) Vastasin ja vaari pyysi minut laivan ravintolaan jossa minua odot- 
taisi yllätys. (9F11) 


Vapaata epäsuoraa esitystä edustavat myös esimerkit 43-44, joita täyden- 
tävät parenteettiset jälkilauseet ajattelin innoissani ja ajattelin: 


43) Tätä minä olen odottanut, tästä päivästä minä olen haaveillut, 
ajattelin innoissani. (9F11) 
44) Aika kiva aamupala, ajattelin. (6F15) 


Vaikka nimitys vapaa kertoo, että esitysmuodosta puuttuu johtoilmaus, 
pidän moniäänisyyttä, sitä että referoitavan ääni kuuluu kertojan äänen 
rinnalla, vapaan epäsuoran esityksen oleellisimpana piirteenä. Sen si- 
jaan irrallinen jälkilause ei ole yhtä merkittävä kuin referaattia edeltävä, 
alistava lause. Sen funktiona on lähinnä täydentää vapaan epäsuoran 
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esityksen referaattia. (Hakulinen ja muut 2004, 1418-1419; Niinimaki 
2015, 201-205). 

Erilaiset puheen ja ajatusten esitysmuodot limittyvat, kuten edelliset 
koululaisten referaatitkin osoittavat. Koska moniääniseksi määrittelyssä 
on paljon rajatapauksia, ei ole tarpeen määritellä eroja tarkasti. Berg 
(2011, 342) toteaa abiturienttien aineistoaineiden referoinnista, että juuri 
vapaa esitys ja toisaalta monivirkkeinen referaatti ovat ongelmallisia ku- 
vattavia, ja referoinnin tunnistaminen ja kategorian määrittäminen voivat 
vaatia koko tekstin tarkastelua. Edelliset esimerkit osoittavat, että moni- 
äänisyyden luominen onnistuu monin keinoin, vaikka varsinkin vapaaksi 
epäsuoraksi esitykseksi nimeäminen saattaa olla tulkinnanvaraista. 

Aikaisemmin vapaata epäsuoraa esitystä nimitettiin eläytymisesityk- 
seksi (ks. Hakulinen ja muut 2004, 1405), jossa viitataan referoitavan 
tuntemuksiin. Tuonkin esiin eläytymisesityksen rinnalla toisen fiktiivi- 
sille teksteille tyypillisen kertojan mielenliikkeitä kuvaavan ilmaisumuo- 
don, tajunnanvirran kuvauksen, jossa välitön ja karsimaton esitystapa 
ovat oleellisia.°° Tajunnanvirrassa kertoja muuttaa omaa kertojan ase- 
maansa: kertova minä muuttuu kokevaksi minäksi, jolloin tekstiin tu- 
lee moniäänisyyden taso. Myös kehittyneissä koululaisten kirjoituksissa 
löytyy tajunnanvirran kuvaukseksi luonnehdittavaa omien tuntojen ku- 
vausta. On huomattava, että Unelmakirjoitelmien tehtävänanto ohjaa 
minäkertojaa tarkastelemaan asioita sisäisestä näkökulmasta, jolloin 
ulkoinen kerronta luontevasti muuttuu sisäiseksi ja moniäänisyyden 
ilmiö toteutuu. 

Esimerkissä 45 kertojan tajunnan kuvauksessa on kysymys moniääni- 
sestä puheesta. Minäkertoja tuo kokevan minän mukana vieraat äänet, 
sanoilla viiltämisen ja pois häätämisen: Tässä tapauksessa moniäänisyys 
syntyy sitäkin kautta, että tajunnanvirrassa käytetään viittauksia ulko- 
puolisten toteutumattomiin puheakteihin. Referointitapa on puheaktin 
kuvaus, jossa referoitavan ääni on mahdollisimman vähän esillä ja jota 
ei selkeästi eroteta muusta kerronnasta. 


60 Kerrontatekniikka, jossa henkilön mielenliikkeet, aistimukset, satunnaiset mielteet, muistumat, jopa 
unet pyritään esittämään mahdollisimman välittömässä ja karsimattomassa muodossa, jatkuvana 
miellevirtana. Samalla rikotaan usein kieliopin, syntaksin ja logiikan sääntöjä. (Hosiaisluoma 2003, 
903.) 
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45) Kun lähden ulos, kukaan ei katso minuun arvostelevasti, kukaan ei 
viillä minua sanoillaan, kukaan ei häädä minua pois. (9M6) 


Koululaiskirjoittajilla on myös sellaista fiktiiviselle kerronnalle ominais- 
ta tekstityypiltään kuvaavaa tekstiä, jossa ympäristön ja tajunnan kuvaus 
sekoittuvat ja jossa kertovaa ja kokevaa minää ei voi erottaa toisistaan. 
Yhdeksäsluokkalaisen tekstin katkelma (esimerkki 46) on moniääninen, 
sillä kertoja vaihtaa kerronnan tasoa omasta tajunnastaan (viikon paras 
päivä) ulkoisen kuvaukseksi (aurinko paistoi; tuuli henkäili hiljaa): 


46) Oli viikon paras päivä, PERJANTAI! Ja päivää vielä paremmaksi 
teki aivan käsittämättömän upea keli. Aurinko paistoi lämpimästi lä- 
hes pilvettömältä taivaalta, tuuli henkäili hiljaa kahisuttaen puiden 
vihreitä lehtiä. (9F13) 


Esimerkissä 47 on lukijalle välittyvää kertojan tajunnan kuvausta. Minä- 
kertoja, luistelijatyttö, jää pohtimaan asioita ja lähestyy lukijaa retorisin 
kysymyksin, jotka myös tuovat tekstiin moniäänistä vuorovaikutteisuut- 
ta. Kertojan asema muuttuu toiminnan kuvauksesta (hermostuminen ja 
kaatuilu) oman toiminnan arvioimiseen ja siirtymiseen kuvitteelliseen 
maailmaan, josta kertoja kertoo epäsuoraan esitykseen rinnastettavin 
että-lausein. Moniäänisyys syntyy, kun asemointi muuttuu kertovasta 
minästä kokevaksi minäksi. 


47) Saatan hermostua oman äitinikin katseesta. Tämä johtaa yleensä 
kompasteluun tai jopa kaatumiseen. Ei kaatumisessa mitään pahaa 
ole, kaikkihan sitä tekevät. Mutta joskus se pistää arsyttämään. Jos 
kaikki katselijat näkevät, kun kaadun, mitä he ajattelevat? Tuomitse- 
vatko he minut sen perusteella huonoksi luistelijaksi tai epäonnistujak- 
si? —— Mutta salaa minä unelmoin, ihan melkein joka kerta, että kym- 
menen hengen sijaan jäällä olisin vain minä. Että kaikkialla vallitsisi 
hiljaisuus, jonka rikkoisi vain minun terieni ääni ja vaimea tömähdys 
vain minun kaatuessani. (9F17) 
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Esimerkeista 45-47 näkyy sekä iän että kirjoittajakohtaisen kehityksen tu- 
loksena lisääntyvä kuvailu ja evaluointi. Nimenomaan vapaan epäsuoran 
esityksen käyttö on kehittyneiden kirjoittajien hallussa. Kehittynyttä kir- 
joitustaitoa näyttää myös osoittavan, että lukijaa johdatteleva johtoilmaus 
on uskallettu jättää pois. Tällöin kokeminen ja kertominen limittyvät ja 
kerronta tiivistyy. Berg (2011, 342) toteaa, että referointikeinojen käyttö 
paljastaa abiturienttien oman syntaksin mahdollisuudet ja rajoitukset. 
Samoin peruskoulun kuudes- ja yhdeksäsluokkalaisilla kyse on ilmeisesti 
myös oman syntaksin kehittyneisyydestä referointitapojen käytössä. 

Oppikirjoissa vapaata epäsuoraa esitystä ei käsitellä peruskoulun aika- 
na, mutta silti jotkut kirjoittajat ottavat esitystavan käyttöönsä tietyssä 
kehityksensä vaiheessa. Tällöin kyse on ilmeisesti kielellisestä harrastu- 
neisuudesta kuten kirjoittamisesta ja lukemisesta, jotka tukevat kielen 
oppimista. Myös S1- ja S2 -ryhmien leksikon kehittymiseen vaikuttaa 
monipuolinen kielellinen harrastuneisuus ja positiivinen suhtautumi- 
nen kieleen (Kalliokoski 20050). 


Lopuksi 


Moniäänisyys on semanttis-pragmaattisesti kompleksinen ilmiö, jonka 
kielentäminen opitaan puhutussa kielessä melko varhain mutta jonka 
siirtyminen kirjoitettuun kieleen on erittäin hidas prosessi. Tämä proses- 
si voi olla kesken vielä peruskoulun päättövaiheissa. Kehitys suhteutuu 
kielellisen koherenssin luomiseen ja kertomusrakenteen tai yleensä 
tekstin rakentamisen oppimiseen (vrt. Mäkinen, Loukusa, Laukkanen, 
Leinonen & Kunnari 2014). Suomalaislapsilla kertomusskeema alkaa 
olla hallinnassa alakoulun lopulla — ei tosin kaikilla — ja referentiaalisten 
viittauksien määrä kasvaa nopeasti niillä lapsilla, joilla kerronta muuten- 
kin onnistuu (ks. Kouvon ja muiden analyysiä tässä teoksessa). Yksiääni- 
sessä kerronnassa referentiaaliset viittaussuhteet ovat yksiselitteisempiä 
kuin moniäänisessä, joten on odotuksenmukaista, että referentiaalinen 
koherenssi täydentyy nopeammin yksiäänisessä kuin moniäänisessä 
kerronnassa. Ongelmat näkyvät muun muassa viittaussuhteiden epä- 
selvyyksinä. 
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Moniäänisyyden kehityksellistä analyysiä on kirjoitetussa kielessä 
tehty pääasiassa kuvaelisitaatioiden avulla. Muu tutkimus on yllättävän 
vähäistä eikä luovasta kirjoittamisesta löydy pitkää kehityskaarta paljasta- 
vaa tutkimusta. Moniäänisyys näyttää kuitenkin olevan ilmiö, jonka 
ymmärtäminen ja tuottaminen vaihtelee herkästi aineiston laadun ja 
tutkimusasetelman mukaan. Kuvaelisitaation avulla tuotettu kirjoitetun 
tekstin moniäänisyys näyttää toteutuvan kehityksellisesti vaihdellen eikä 
muutos osoittaudu iän mukaan lineaariseksi. Esimerkiksi sammakkota- 
rinan elisitaatiossa pienet lapset ja toisaalta aikuiset käyttävät paljon suo- 
raa esitystä ja viisitoistavuotiaat taas epäsuoraa (Nordgvist 2001). Näin 
voisi tehdä sen johtopäätöksen, että moniäänisyys kehittyy U-käyrän 
tapaisesti. Tilanne ei kuitenkaan vastaa Unelmakirjoitelmien suoran ja 
epäsuoran kielentämisen suhdetta. Unelmakirjoitelmissa suora esitys 
on alaluokilla yleisempää ja sen esiintyvyys laskee tasaisen lineaarisesti 
peruskoulun loppuun, ja aikuisilla epäsuora esitys on huomattavasti 
suoraa yleisempää. Samalla kertova minä antaa tilaa kokevalle. Koska 
moniäänisyyden analyysi on herkkä tutkimusmetodille, on hyvin mah- 
dollista, että tämä tulos riippuu unelmateemasta: lapset kirjoittavat toi- 
minnallisia Unelmakirjoitelmia, nuoret aikuiset kokemuksellisia. 

Tässä tutkimuksessa aineisto on kerätty kirjoitustehtävän avulla sa- 
masta teemasta, ja kirjoitelmia on peruskoulun kaikilta vuosiluokilta 
sekä nuorilta aikuisilta. Analyysi keskittyi peruskoulun päättövaiheisiin 
eli kuudes- ja yhdeksäsluokkalaisiin, mutta jotta moniäänisyyttä voi- 
tiin suhteellisen yhtenäisessä aineistossa tutkia kehityksellisen kaaren 
mukaan, alustava kehityskartoitus tehtiin alakoulun luokkien 1.5. ai- 
neistosta. Aineisto analysoitiin sen mukaan, miten moniäänisyyden 
kielentäminen alkaa ja miten se jatkuu. Kirjoitelmat arvioitiin ensin las- 
kemalla, monessako niistä ylipäätään ilmenee moniäänisyyttä, ja sitten 
sen mukaan, minkätyyppistä moniäänisyyden lajia niissä kielennettiin. 

Kaikissa alaluokkalaisten kirjoitelmissa esiintyy intertekstuaalisuutta. 
Se edustuu alakoulun alussa nuorimpien kirjoittajien kirjoitelmissa lä- 
hinnä pelien ja kirjojen sekä muiden populaarikulttuurin tuotteiden ni- 
minä. Voisi myös kuvitella, että unelmana hyvin tyypillinen lottovoitto ja 
sillä hankittavat auto, talo ja maailmanympärysmatka kaiuttavat 8-vuo- 
tiailla ennemmin kulttuurista kuin omaa unelmaa. Kuudesluokkalaisilla 
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intertekstuaalisuus on jo muualta saatua tietoa, liittyy lapsen omaan to- 
dellisuuteen ja lavenee iän myötä toisen todellisuuden luomiseen. Kyse 
voi olla esimerkiksi unelmapeleistä tai suosikkiyhtyeistä, joiden avulla 
rakennetaan kohtaamisia, joissa kirjoittajalla on epätavallinen ja todelli- 
suudessa epätodennäköinen rooli. Kielellisesti toista todellisuutta raken- 
netaan usein konditionaalimuodolla, ja ongelmaksi voi tulla, että kir- 
joittaja ei osaa niitä kielellisiä ajan ilmaisun keinoja, joilla hän siirtyisi 
reaalimaailman ja kuvitellun maailman välillä. Ongelma on yleinen vielä 
yhdeksäsluokkalaisilla ja erityisesti pojilla. Tempus- ja modusongelmat 
näkyvät moniäänisessä tekstissä myös nykyhetken ja menneen ajan il- 
maisuissa. 

Metakieltä esiintyy sekä aloituksissa että lopetuksissa iän mukaan li- 
sääntyvästi, mutta lukijan suoraa — hallittua — puhuttelua esiintyi vain 
vanhemmilla kirjoittajilla. Aineistoni kuudes- ja yhdeksäsluokkalaisten 
teksteistä löytyy kertomuksen metatasoon kuuluvaa vuorovaikutukseen 
kategorisoitavaa moniäänisyyttä, oman tekstin tai tekstin tuottamisen 
asettamista kommentoinnin kohteeksi ja tietoisen vuorovaikutuksen 
luomista lukijaan — tai ainakin sellaisen tavoittelua. Metakielisyyttä 
näkyy lukijalle esittäytymisessä, tekstin kulun kommentoimisessa ja 
vuoropuhelussa. Kun kuudesluokkalaisten metakielelliset keinot ovat 
yksinkertaiset ja suorat, yhdeksäsluokkalainen suoriutuu samasta koko- 
naisvaltaisemmin jaksottamalla esimerkiksi koko kirjoitelmansa meta- 
kielisiin raameihin. Kuudesluokkalainen toistaa kirjoitelmansa aloi- 
tuksessa tyypillisesti tehtävänannon, yhdeksäsluokkalainen sen sijaan 
pohtii ja evaluoi sanojen merkityksiä, esimerkiksi unelman käsitettä. 
Hän käyttää myös toistoa tai muita kohosteisia keinoja, joilla voi painot- 
taa tekstiä kokonaisvaltaisemmin. 

Suoran esityksen kaksi keskeistä funktiota Unelmakirjoitelmissa ovat 
juonen kuljetus ja puhujien luonnehdinta. Juonenkuljetusfunktio on 
hallitsevana ja toteutuu usein raskaana dialogimuotona. Puhujien luon- 
nehdinnassa on sen sijaan käytössä moninaisempia ja osuvampia kei- 
noja. Esimerkiksi eräs kuudesluokkalainen poika sijoittaa itsensä näppä- 
risti ja ironisestikin omalle murrealueelleen parilla sanalla: Häh! Mitä 
nyt? Kui näi aikasi? (6M19). Kehyslauseita ei joka yhteydessä käytetä 
mutta muuten illokutiiviset sävyt monipuolistuvat. Muodollisesti refe- 
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rointi on 2.-5.-luokkalaisilla ikään kuin referointijatkumon asteikolla, eli 
deiktisiä muutoksia ei tehdä systemaattisesti ja sekä persoona-, tempus- 
että spatiaalinen deiksis huojuvat (ks. myös Vesala 2012). Referoinnin 
merkintäkonventiot ovat alakoululaisilla useimmiten tuntemattomia. 
Yhdeksäsluokkalaisilla on suoraa esitystä niin vähän, että välimerkkien 
käyttö ei erotu. Alakoululaisten aineistossa lähinnä persoonadeiksis so- 
veltui suoran ja epäsuoran esityksen erottelukriteeriksi ja osittain piti 
tukeutua laajempaan kontekstiin; kuudesluokkalaiset jakautuvat tässä 
kahteen eritasoiseen ryhmään. 

Ensimmäisen luokan aineistosta ei löydy lainkaan referointia. Sekä 
suora että epäsuora esitys lisääntyvät toiselta luokalta kuudennelle, mut- 
ta jo neljännellä luokalla alkaa epäsuoran esityksen suhteellinen määrä 
nousta. Viidennen ja kuudennen luokan pojat käyttävät epäsuoraa esi- 
tystä suoraa enemmän. Yhdeksäsluokkalaiset käyttävät suoraa esitys- 
tä erittäin vähän; tämä on vertailututkimusten mukaista. Esimerkiksi 
Nordgvistin (2001) aineistossa juuri viisitoistavuotiaat käyttävät epäsuo- 
raa esitystä eniten koko eri-ikäisten koehenkilöiden joukosta. Koululais- 
kirjoittaja ottaa epäsuoralla esityksellä etäisyyttä referoitavaan tapahtu- 
maan kerrontahetken perspektiivistä. Epäsuoran esityksen funktio on 
vielä kuudesluokkalaisilla edistää juonta, mutta yhdeksäsluokkalaisilla 
funktio on enenevästi episteeminen ja epäsuoralla esityksellä kuvataan 
ennemmin kertojan tai puhujan ajatuksia kuin tapahtumia sinänsä. 
Muodollisesti epäsuoran esityksen merkintätavat horjuvat samoin kuin 
suoran esityksen. Kerronta saa myös vapaan epäsuoran esityksen piirtei- 
tä, muun muassa koska kehystäminen usein puuttuu. Deiktiset elemen- 
tit voivat silloin olla kerrontatilanteen mukaiset mutta sanavalinnat ovat 
aikaisemman puhetilanteen ja alkuperäisen puhujan valintoja. Vapaa 
epäsuora esitys on ominaista yhdeksäsluokkalaisille kirjoittajille ja on 
osaksi tietoista tajunnanvirtaa, osaksi vaikuttaa sattumanvaraiselta. 

Puhutussa kielessä jo kaksivuotiaat lapset käyttävät moniäänistä il- 
maisua. Puhutussa kielessä moniäänisyyttä voidaan esittää esimerkiksi 
multimodaalisilla keinoilla, mutta kirjoitetussa kielessä tilanne on han- 
kalampi. Yleistä näyttää olevan, että erilaiset viittaussuhteet ja deiktiset 
muunnokset, referoinnin eri funktiot ja kielellisen esittämisen tavat 
sekä hallittu lukijaan viittaaminen tulevat hallintaan samalla, kun kerto- 
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van tekstin kertomusrakenne tai -skeema aletaan hallita. Kehitys on pit- 
kä ja oppiminen hidasta, ja kaikki yläkoululaisetkaan eivät näytä pääse- 
vän tähän vaiheeseen. Serratrice, Hesketh ja Ashworth (2015) osoittavat 
priming- eli toistoasetelmalla, että moniäänisyyden ilmaisun keinojen 
oppimista auttaa aikuisen antama syötös. Jos kouluikäisille lapsille esi- 
merkiksi luetaan moniäänisiä tekstejä, vaikutus heijastuu moniääni- 
syyden esittämiseen myös kirjoitetussa kielessä esimerkiksi siten, että 
johtolauseissa käytetyn sanaston diversiteetti kasvaa ja rakenteet moni- 
puolistuvat. Myöhemmin toteutettu seurantatutkimus myös osoitti, että 
vaikutus on pitkäaikainen. Toisin sanoen kyky ilmaista moniäänisyyttä 
hyötyy mallista ja opettamisesta. 

Unelmakirjoitelmissa huomio kiinnittyy kirjoitelmien suuriin eroi- 
hin. Toisessa päässä ovat kirjoittajat, joiden kertomuksen genreen kuu- 
luva teksti on yksiäänistä kuudennella vuosiluokalla ja vielä peruskoulun 
päättövaiheessa. Vuorovaikutuksen taidot puuttuvat, eikä referoitua pu- 
hetta tai ajattelua osata erottaa muusta tekstistä. Toisessa päässä ovat 
kirjoittajat, jotka osaavat lähestyä lukijaa tarkoituksenmukaisesti ja luoda 
kokemuksiinsa perustuvan kuvan omasta sisäisestä ajatusmaailmastaan. 
Kielenhallinta ja kirjoitustaidot luonnollisesti vaihtelevat, ja jokaisen ei 
ehkä tarvitse osata kirjoittaa samalla tavalla tai tasolla. Voi kuitenkin 
kysyä, vaihteleeko osaaminen odotettua enemmän ottaen huomioon, 
että opetuksen pitäisi vähentää taitoeroja. Voi myös kysyä, edistäisikö 
oppimista nykyistä systemaattisempi kieliopin ja semanttis-pragmaat- 
tisten ilmiöiden kielentämisen opettaminen (vrt. esimerkiksi Seppänen 
2015; Rättyä 2017). 
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Il 
Muodot ja rakenteet 


Myöhemmän kielenkehityksen vaiheissa I osion luvut osoittivat, että 
sanaston diversiteetti kasvaa voimakkaasti ja semantiikan hallinta mo- 
nipuolistuu. Kehitys näkyy niin sanojen määrän kasvuna, niiden konk- 
reettis-jatkumon monipuolistumisena kuin erilaisten kompleksisten 
semanttisten ilmiöiden kielentämisen taitojen lisääntymisenä, on 
sitten kyse spatiaalisten suhteiden ilmaisuista, tekstin semanttisen 
koherenssin luomisesta tai moniäänisyyden ilmaisuista. Aikuistasoa ei 
tosin vielä peruskoulun aikana saavuteta. 

Tämän osion luvuissa näkökulma on puhutun ja kirjoitetun kielen 
kehityksellisessä suhteessa ja kirjoitetun kielen rakenteessa. Lasten var- 
hainen kielenkehitys on yksinomaan puhutun kielen haltuunottoa ja 
myöhemmän kielenkehityksen varhaisvaihe nojaa sekin vahvasti puhu- 
tun kielen malliin. Laasanen ja Pajunen keskittyvät pohtimaan puhutun 
ja kirjoitetun kielen keskinäistä suhdetta yleensä sekä muutoksen etene- 
mistä puhutusta kielestä kirjoitettuun kieleen, Honko tarkastelee muun 
muassa äänne-kirjain-vastaavuuden oppimista sen mukaan, miten se 
näkyy kirjoitetun kielen norminmukaisuuden kasvuna. Pajunen ja 
Vainio tarkastelevat ensin, miten puhutun kielen yksinkertainen raken- 
ne kirjoitetussa kielessä iän mukaan monimuotoistuu eli kompleksis- 
tuu, ja seuraavaksi he pyrkivät selvittämään, mistä aineksista kielen 
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kompleksisuus oikeastaan syntyy. II osion joka luvussa kehitystä tarkas- 
tellaan aineistona kielen muotoyksiköt. Kun I osiossa analyysin lähtö- 
kohtana olivat merkitykset ja niillä ilmaistavien ilmiöiden analyysi, 
II osiossa on edetty poimimalla analysoitavaksi kielellisiä rakenteita. Ero 
heijastuu kielenhallinnan kehitysnopeuteen ja toisaalta tulosten kieli- 
typologiseen vertailtavuuteen: muotojen tasolla kehitys on periaatteessa 
nopeampaa mutta vertailtavuus muihin kieliin heikompaa. Fro näkyy 
myös ikäkausimediaanien esittämisessä: ilmiötasolla variaatio kasvaa 
oppimisen myötä, rakennetasolla voidaan helpommin esittää ikäkausit- 
taisia yleistyksiä ainakin kertovasta tekstistä. 

II osion ensimmäinen luku tarjoaa analyyseille taustan pohtimalla ja 
määrittelemällä puhutun ja kirjoitetun kielen suhdetta käsitteellisellä 
tasolla. Luvussa suhde nähdään siten resiprookkiseksi, että puhutulla ja 
kirjoitetulla kielellä on yhteinen ydin ja vaikutus voi kulkea molempiin 
suuntiin. Kyse ei siten ole täydestä erilaisuudesta mutta ei myöskään täy- 
destä samanlaisuudesta. Suhdetta tarkastellaan yhtäältä teoreettisella ta- 
solla ja toisaalta empiirisellä tasolla tutkimalla suomenkielisen aineiston 
avulla, miten sosiolingvistisin metodein todennettu puhutussa kielessä 
tapahtunut muutos näkyy kirjoitetussa kielessä. Jos nyt puhuttu ja kirjoi- 
tettu kieli edustavat samaa kielellistä systeemiä (tai ydintä) ja puhuttu 
kieli saadaan haltuun ensin, voisi olettaa, että kielenmuutoksen konteks- 
tissa puhutussa kielessä jo toteutuneet tai meneillään olevat muutokset 
heijastuvat kirjoitettuun kieleen, vaikkakin viipeellä. Puhutun kielen vai- 
kutus kirjoitettuun ei kuitenkaan ole näin suoraviivainen. Sama kaksi- 
suuntainen vuorovaikutus ja toisaalta erilaistuminen näkyy kaikissa 
osion luvuissa. Tuloksista voi päätellä, että kirjoitettuun kielimuotoon 
kasvaminen ei käy itsestään eikä yksinomaan puhutun kielen perusteel- 
la. Tiivistäen on sanottava, että kirjoitettuun kielimuotoon kasvaminen 
edellyttää systemaattista opettelua ja opettamista. 
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Johdanto 


Puhuttu ja kirjoitettu kieli ovat kielen eri modaliteetteja eli ilmenemis- 
muotoja. Puhuttu kieli on akustinen ilmiö, jonka havaitseminen perus- 
tuu useimmiten kuuloaistiin. Kirjoitettu kieli on puolestaan fyysinen 
ilmiö, jonka havaitseminen perustuu useimmiten näköaistiin. Tästä on- 
tologisesta erosta seuraa modaliteettien ominaisuuksiin liittyviä eroja, 
joista puolestaan voi seurata funktionaalisia eroja. Esimerkiksi kirjoitettu 
kieli on yleensä pysyvämpää kuin puhuttu kieli, joten kirjoitettua kieltä 
käytetään enemmän tiedon tallentamiseen. Eroista huolimatta puhuttu 
ja kirjoitettu kieli ovat kuitenkin saman ilmiön kaksi ilmentymää, minkä 
todistaa se, että samat kuvausmetodit sopivat kumpaankin (ks. Itkonen 
2010, 117). Puhutun ja kirjoitetun kielen perimmäinen samuus on to- 
dennäköisesti helpommin havaittavissa kielen ylemmillä kuin alemmilla 
tasoilla. Esimerkiksi normaalipainotteinen suora sanajärjestys on suo- 
messa puhutussa ja kirjoitetussa kielessä molemmissa tyyppiä subjekti 
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— verbi — objekti. Täten voi sanoa, että puhutun ja kirjoitetun kielen perus- 
kielioppi on sama (ks. Hakulinen 2003, 5). Yksityiskohtaisemmassa tar- 
kastelussa puhutun ja kirjoitetun kielen välillä voi havaita eroja, joiden 
perusteella voi puhua puhutun ja kirjoitetun kielen malleista. Lapsen en- 
simmäinen opittu modaliteetti on puhuttu kieli ja kirjoitettu kieli opi- 
taan yleensä hieman myöhemmässä vaiheessa. Tästä seuraa se, että kie- 
lenoppiminen jatkuu vielä alkuvaiheen jälkeenkin (myöhempi kielenkehi- 
tys, ks. tarkemmin Pajusen ja Hongon esittelyä johdantoluvussa). 

Puhutun kielen tutkimuksissa on havaittu, että suomen possessiivi- 
suffiksin käyttö on vähentynyt (ks. esim. Kangasmaa-Minn 1986; Ikola 
1992; Paunonen 1995; Korhonen 2006). Toisinaan possessiivisuffiksin 
käytön vähenemisen arvellaan olevan leviämässä myös kirjoitettuun kie- 
leen (ks. esim. Ikola 1992; Paunonen 1995; Varjonen 1996; Niemi 2018). 
Tällöin oletuksena on siis se, että muutos alkaa puhutussa kielessä ja 
etenee jollain aikavälillä kirjoitettuun kieleen uuden puhutun kielen 
mallin vallatessa alaa aiemmalta kirjoitetulta mallilta. Kirjoitetun kielen 
osalta tilannetta ei ole kuitenkaan tutkittu, vaan havainnot perustuvat 
yksittäisiin esimerkkeihin. Koska puhekielen tutkimuksissa liitteettö- 
myys on vahvistunut varsin nopeasti, voivat yksittäiset esimerkit antaa 
sen kuvan, että muutos on todellakin leviämässä kirjoitettuun kieleen. 
Kyse on kuitenkin subjektiivisista arvioista, ei tutkitusta tiedosta. 

Sosiolingvistinen meneillään olevan kielenmuutoksen tutkimus 
on ensisijaisesti puhutun kielen tutkimusta, jossa nuorten ryhmä on 
usein avainasemassa muutoksen nopeuden ja suunnan tunnistamisen 
suhteen, sillä nuoret puhujat ovat usein muutoksen kärjessä (ks. esim. 
Labov 2001; Aitchison 2003, 739; Tagliamonte & D'Arcy 2009). Tästä 
huolimatta kehityksellisiä tekijöitä ei ole näissä tutkimuksissa juurikaan 
huomioitu (ks. Laasanen, Pajunen & Häikiö, arvioitavana). On täysin 
mahdollista, että nuorten ryhmään kuuluvat puhujat eivät (vielä) hallitse 
kirjoitetun kielen mukaista possessiivisuffiksin käyttöä, mikä saattaa vai- 
kuttaa tutkimustuloksiin esimerkiksi hidastamalla muutoksen nopeut- 
ta. Toisaalta on myös mahdollista, että kirjoitetussa kielessä havaittu 
variaatio suffiksin käytön suhteen ei ole merkki muutoksesta vaan ai- 
noastaan pidempiaikaisesta vaihtelusta ja kirjoittamisen muutoksista 
(ks. Weinreich, Labov & Herzog 1968, 188). 
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Tämän luvun tarkoituksena on selvittää, näkyykö kirjoitetussa kieles- 
sä merkkejä possessiivisuffiksin käytön vähenemisestä. Luku jakaantuu 
kahteen osaan. Ensimmäisessä osassa esitellään sosiolingvististä meneil- 
lään olevan kielenmuutoksen tutkimusta ja argumentoidaan puhutun ja 
kirjoitetun kielen perimmäisen samanlaisuuden puolesta. Tutkimuksen 
toisessa osassa esitellään ensin suomen possessiivisuffiksia ja sen tut- 
kimusta puhutussa kielessä ja tämän jälkeen tarkastellaan possessiivi- 
suffiksin käyttöä ja kehitystä kirjoitetussa kielessä aikavälillä 1940-2010 
eriaikaisten korpusten avulla. Tämän tarkastelun vertailukohtana käyte- 
tään puhutussa kielessä tehtyjä havaintoja ja ennusteita suffiksin käytön 
nopeasta vähenemisestä. Tutkimuksen taustalla on oletus, että lapsen 
myöhempi kielenkehitys rakentuu aluksi puhutun kielen malliin ylei- 
seen ja yksinkertaiseen perustuen mutta irtautuu ja laajenee siitä myö- 
hemmin, kuten possessiivisuffiksien käytöllä pyrimme osoittamaan. 

Kielimuotojen terminologiasta on kirjoitettu varsin paljon (ks. esi- 
merkiksi Ikola 1972; 1986; Hiidenmaa 2005; Nuolijärvi & Sorjonen 
2010, 15-18; Viinikka & Voutilainen 2013). Ensinnäkin tulee erottaa pu- 
huttu ja kirjoitettu kieli omaksi kategoriakseen, kuten tekee myös Ikola 
(1972, 16). Siinä missä puhutun ja kirjoitetun kielen välinen ero on on- 
tologinen modaliteettiero, varsinaisten kielimuotojen, mm. kirjakieli, 
yleiskieli, puhekieli ja murre välinen ero ei ole. Tämä tarkoittaa sitä, että 
ainakin teoriassa jokainen näistä kielimuodoista voi ottaa puhutun tai 
kirjoitetun kielen määritteekseen eli voimme puhua esimerkiksi kirjoi- 
tetusta puhekielestä tai puhutusta kirjakielestä. Ongelmaksi saattaa kui- 
tenkin muodostua käsite kirjakieli historiallisen painolastinsa vuoksi (so. 
alkujaan kirjakieli viittasi nimenomaan preskriptiiviseen kirjoitettuun 
kieleen). Esimerkiksi Ikola (1986, 5) pitää kirjakieltä ainoastaan yhtenä 
kirjoitetun kielen muotona. Preskription määrä on kuitenkin yksi tapa 
ymmärtää käsitteet: tietyssä mielessä käsitteet voidaan asettaa jatkumol- 
le siten, että esimerkiksi kirjakieli tai kirjoitettu yleiskieli on jatkumon 
yhdessä päässä riippuen siitä, ymmärretäänkö kirjakieli yksinomaan kir- 
joitetun kielen muodoksi, yleiskielen synonyymiksi vai yleiskieltä vielä 
preskriptiivisemmäksi kielimuodoksi. Jatkumon toiseen päähän sijoittu- 
vat murteet tai mahdollisesti erityyppiset aluepuhekielten muodot ja 
sosiaalisten ryhmien varieteetit. Tässä tutkimuksessa käytämme käsi- 
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tettä kirjakieli yhdessä kirjoitetun kielen kanssa siitä syystä, että monissa 
lähteissä lähes järjestään puhutaan kirjakielestä. Siten tuntuu turhalta 
korvata käsite kirjakieli esimerkiksi kirjoitetulla yleiskielellä, varsinkin kun 
määritelmistä ei vallitse yksimielisyyttä. Aivan vastaavasti käytämme kä- 
sitettä murre (pro aluepuhekieli tms.). Emme ota kantaa siihen, miten 
kielimuotojen käsitteet tulisi määritellä tai ymmärtää. Tärkeää on käsit- 
teiden välinen suhde tai ero, joka on ymmärrettävissä, vaikka käsitteet 
itsessään eivät välttämättä olisi yksiselitteisiä. 


Meneillään olevan kielenmuutoksen tutkimus 


Meneillään oleva kielenmuutos on monimutkainen tutkimuskohde, jos- 
sa yhdistyvät mm. kielentutkimuksen synkroninen ja diakroninen näkö- 
kulma sekä vakaa ja epävakaa kielellinen vaihtelu. Meneillään olevan 
kielenmuutoksen tutkimus on tyypillisimmillään ollut sosiolingvististä 
puhutun kielen tutkimusta. Historiallinen sosiolingvistiikka siirsi paino- 
pisteen takaisin historiaan ja alkoi tarkastella kirjoitettua kieltä. Meneil- 
lään olevan kielenmuutoksen tutkimus uudemmassa kirjoitetussa kie- 
lessä on kuitenkin jäänyt vähemmälle huomiolle, samoin kuin meneil- 
lään olevan muutoksen etenemisen tutkimus puhutusta kielestä kirjoi- 
tettuun kieleen. Tutkimuksemme paikkaa puutetta analysoimalla pos- 
sessiivisuffiksin käyttöä ja kehitystä kirjoitetussa kielessä eri vuosikym- 
meninä sekä selvittämällä, näkyykö kirjoitetussa kielessä merkkejä 
oletetusta possessiivisuffiksin käytön vähenemisestä. Possessiivisuffik- 
sin käyttöä on tarkasteltu aiemmin yllättävän vähän kirjoitetun kielen 
kontekstissa (ks. Varjonen 1996). Lisäksi muutamassa opinnäytetutki- 
muksessa tarkastellaan suffiksien käyttöä Sr- ja S2 -oppijoiden kielessä 
(ks. esimerkiksi Tiainen 2008; Turunen 2012), mutta koululaisten pos- 
sessiivisuffiksien käytöstä ei ole tehty pitkittäistutkimusta, vaikka omis- 
tus- ja viitesuhteiden ilmaisukeinot ansaitsisivat tulla tutkituiksi. 
Meneillään olevan kielenmuutoksen tutkimus kirjoitetussa kielessä 
leikkaa kahden metateoreettisen dimension lävitse, joista toinen koskee 
tutkimuksen ajallista etäisyyttä muutokseen ja toinen kielen ilmenemis- 
muotoja. Näistä ensimmäistä on käsitelty laajemmin muualla (ks. Laasa- 
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nen 2016), joten pääpaino tässä yhteydessä on kielen ilmenemismuo- 
tojen tarkastelussa. 

Historiallinen kielitiede tarkastelee kielen kehittymistä pitkällä aika- 
välillä vertaamalla synkronisia kielentiloja toisiinsa. Tarkasteltavana ovat 
yleensä tällöin jo päättyneet muutokset, ja koska tarkastelu toteutetaan 
ajallisesti kaukaa, on kuva muutoksesta usein ainakin kohtuullisen sel- 
keä. Historiallinen kielitiede perustuu vertailuun ja rekonstruktioon, joi- 
ta tukee erilaisten kirjoitettujen dokumenttien tutkimus (ks. Campbell 
2013). Leonard Bloomfield ennakoi meneillään olevan kielenmuutoksen 
tutkimusta varsin tarkkaan (ks. Bloomfield 1951 [1933], 347; Laasanen 
2016), mutta varsinainen meneillään olevan kielenmuutoksen tutki- 
mus sai alkunsa vasta muutama vuosikymmen myöhemmin Labovin 
1960-luvun sosiolingvististen tutkimusten myötä (ks. Labov 1963; 1966). 
Keskeiseksi tutkimusmetodiksi nousi näennäisaikametodi, jonka mu- 
kaan ”- — 50-vuotiaiden kieli hetkellä x heijastelee 70-vuotiaiden kieltä 
vuonna x + 20 ja 30-vuotiaiden kieli 70-vuotiaiden kieltä hetkellä x + 40” 
(Kurki 2005, 33). Myöhemmin näennäisaikaa hyödyntävien näennäisai- 
katutkimusten rinnalle nousi vielä reaaliaikainen tutkimus, jossa muu- 
toksen etenemistä voidaan seurata reaaliajassa esimerkiksi uusimalla 
aiemmin tehty näennäisaikatutkimus. Sosiolingvistinen meneillään ole- 
van kielenmuutoksen tutkimus on ensisijaisesti synkronista kielentutki- 
musta, sillä eri ikäryhmiin perustuva vertailu tapahtuu yhden kielentilan 
sisällä. Ajallinen etäisyys muutokseen on huomattavasti pienempi 
kuin historiallisessa kielitieteessä yleensä, minkä takia kuva muutok- 
sesta voi ajoittain olla epäselvä. Tästä seuraa se, että toisinaan voi olla 
hyvinkin vaikeaa erottaa muutosta kielellisestä variaatiosta. 

Hiukan yksinkertaistaen voi todeta, että siinä missä historiallisen kieli- 
tieteen aineistona toimii (pääasiallisesti) kirjoitettu kieli erilaisten kielen- 
muistomerkkien muodossa, on tilanne päinvastainen sosiolingvistisen 
meneillään olevan kielenmuutoksen tutkimuksen kohdalla, jossa aineis- 
tona toimii puhuttu kieli erilaisten nauhoitteiden muodossa. Näitä 
kahta tutkimustyyppiä täydentää historiallinen sosiolingvistiikka, joka 
sai alkunsa Romainen (1982) sovellettua sosiolingvistiikan tutkimus- 
metodeja historiallisen syntaksin tutkimukseen. Historiallinen sosio- 
lingvistiikka on muutoksen ja variaation tutkimusta, jossa aineistona 
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toimii jälleen kirjoitettu kieli, esimerkiksi kirjeet ja päiväkirjat (ks. 
Nevalainen & Raumolin-Brunberg 2012). Muutoksen tutkimuksen 
näkökulmasta ainoa mikä tästä kuvasta puuttuu, on meneillään olevan 
kielenmuutoksen tutkimus kirjoitetussa kielessä. 

Näennäisaikaisissa tutkimuksissa muutoksen suunta ja nopeus lue- 
taan vertaamalla vanhempien puhujien puhetta nuorempien puhujien 
puheeseen, mikä asettaa nuoret puhujat kriittiseen asemaan muutoksen 
suunnan ja nopeuden tunnistamisen kannalta. Perinteisesti näennäis- 
aikametodin suurimmaksi ongelmaksi on nostettu ikäsidonnaisuus 
(age-grading), joka tarkoittaa tietylle iälle tyypillistä mutta ohimenevää 
vaihetta (ks. Chambers 1995, 188). Yleensä kyse on nuorille puhujille 
tyypillisestä ilmiöstä, esimerkiksi suomessa x-grafeemin käyttö ks-yh- 
tymän paikalla 1980-luvulla (ks. Kurki 2013, 210). On huomattava, että 
ikäsidonnaisuus ei viittaa suoraan kehityksellisiin tekijöihin, vaikka tä- 
mäkin olisi ainakin periaatteessa mahdollista. U-käyrässä sosiaalistu- 
minen erilaisten (ikä)ryhmien tyypillisiin kielenkäyttökoventioihin voisi 
selittää esimerkiksi sitä, että vältellään hyperkorrektiksi tulkittavia muo- 
toja, jollainen possessiivisuffiksikin voi olla ainakin tietyissä medioissa 
ja tekstilajeissa tai tuttavallisiksi oletetuissa vuorovaikutussuhteissa tai 
tilanteissa. Kehityksellisten tekijöiden huomiotta jättäminen saattaa 
kuitenkin vähentää näennäisaikaisten tutkimusten luotettavuutta, sillä 
riippuen tutkittavista kielenpiirteistä, nuorten puhujien kielellinen käyt- 
täytyminen saattaa heijastaa myös kehityksellisiä tekijöitä yhteisöllisen 
muutoksen (ks. Labov 1994, 84) lisäksi tai sijaan. Reaaliaikainen tutki- 
mus on näennäisaikaista tutkimusta huomattavasti luotettavampi muu- 
toksen tunnistamisessa, sillä siinä muutoksen tunnistaminen perustuu 
useampaan (yleensä kahteen, mutta ks. kuitenkin Lappalainen, Mustan- 
oja & O'Dell 2019; reaaliaikaisen tutkimuksen luotettavuudesta ks. 
myös Kuparinen, Mustanoja, Peltonen, Santaharju & Leino 2019) syn- 
kroniseen tilannekuvaan. Reaaliaikaisen tutkimuksen myötä on havait- 
tu, että yksilöiden kieli voi muuttua vielä aikuisiälläkin, jolloin puhutaan 
elinikäisestä muutoksesta (lifespan change, ks. Sankoff 2006; 2018). Kä- 
sitteenä elinikäinen muutos liittyy myös kielenoppimiseen ja -hallintaan 
myöhemmällä iällä (ks. esimerkiksi Ramscar, Hendrix, Love & Baayen 
2.013). 
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Puhutun ja kirjoitetun kielen samuus ja erilaisuus 


Ontologisesta näkökulmasta katsottuna puhuttu kieli on ensisijainen, 
kun taas kirjoitettu kieli on suhteellisen uusi keksintö (ks. Bloomfield 
1951 [1933], 282; Hockett 1958, 4). Esimerkiksi suomen kielen kirjoite- 
tun kielen katsotaan alkaneen kehittyä 1500-luvulla, jota ennen kieli oli 
ollut olemassa ainoastaan puhuttuina murteina.™ Kirjoitettu kieli käsit- 
teenä ei myöskään ota kantaa siihen, minkä tyyppisestä kielestä on kyse. 
Täten kirjoitettu kieli voi olla yhtä hyvin yleiskieltä kuin aluemurretta, 
mistä hyvänä esimerkkinä ovat Aku Ankka -sarjakuvien murreversiot. 
Kirjoitetun puhekielen voidaan myös katsoa hälventävän puhutun ja kir- 
joitetun kielen rajaa (ks. Viinikka & Voutilainen 2013, 18). 

Perinteisen näkemyksen mukaan kirjoitettu kieli on puhuttua kieltä 
kuvaava merkkien järjestelmä. Tämän Aristoteleeseen asti palautuvan 
näkemyksen edustajiin kuuluvat niin Saussure (1962 [1916]), Bloom- 
field (1951 [1933]) kuin Hockettkin (1958). Näkemyksen edustajat koros- 
tavat puhutun kielen olevan lingvistiikan ensisijainen tutkimuskohde 
ja sallivat kirjoitetulle kielelle lähinnä metodologisen aseman kielen 
säilyttäjänä ja historiallisen lingvistiikan mahdollistajana. Näin ajattelee 
esimerkiksi Sturtevant (1917, 10). Vastakkaisen näkemyksen mukaan 
kirjoitettu kieli on kuitenkin huomattavasti itsenäisempi symbolisystee- 
mi kuin perinteisen näkemyksen edustajat ajattelevat. Näin taas kirjoitti 
jo Penttilä (1932, 17-19), jonka mukaan varhaisin kirjoitus eli kuvakirjoi- 
tus ei vastannut puhutun kielen aineksia käytännössä lainkaan. Penttilä 
ei kuitenkaan pitänyt puhuttua ja kirjoitettua kieltä täysin itsenäisinä 
järjestelminä vaan näki niiden välillä varsin pitkällekin menevää vastaa- 
vuutta. Huomattavasti radikaalimman ajatuksen esittää Linell (1982, 
44), jonka mukaan puhuttua ja kirjoitettua kieltä ei välttämättä hallitse 
yksi ja sama kielijärjestelmä (Saussuren langue) vaan kaksi osittain pääl- 
lekkäistä järjestelmää (la langue de la parole ja la langue de Vecriture; 
ks. myös Goody 1977, 76-77; Kravchenko 2011). Sekä perinteinen että 
Linellin esittämä näkemys vaativat korjaamista. Kirjoitettu kieli ei redu- 


61 Heikkilän (2017) tutkimuksen mukaan suomenkielisiä kirjoitettuja sanoja löytyy kuitenkin jo tätä var- 
haisemmista teksteistä. 
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soidu puhutun kielen kuvaukseksi, mutta se ei ole myöskään itsenäinen 
järjestelmä. Coulmas (1989) kirjoittaa, että luonnollinen kieli on yksi- 
tyiskohtaisin ja täsmällisin symbolijärjestelmä, joka ihmisillä on käy- 
tössään. Olisi teoreettisesti mahdollista, että puhutun kielen rinnalle 
voitaisiin kehittää uusi, puhutusta kielestä täysin irrallinen ja itsenäinen 
kirjoitusjärjestelmä, joka kuitenkin vastaisi monimutkaisuudeltaan ja 
ilmaisuvoimaltaan puhuttua kieltä. Tämä olisi kuitenkin harvinaisen 
epäekonomista, sillä se käytännössä tarkoittaisi kielen rakentamista uu- 
delleen. (Mts. 27.) 

Puhutun ja kirjoitetun kielen takana oleva yhteinen ydin mahdollistaa 
sen, että kieliä, joita ainoastaan puhutaan, voidaan kuvata saman käsit- 
teistön avulla kuin kieliä, joita myös kirjoitetaan (Itkonen 2004, 268). 
Tämän osoittaa todeksi P.. inin kielioppi (Astadhyayi, noin 400-500 
eKr), jota Bloomfield (1970 [1929], 219) kutsui yhdeksi ihmisälyn suu- 
rimmista monumenteista. Astädhyäyt koostuu hieman alle 4000% 
säännöstä ja kuvaa Päninin ajan puhuttua sanskritia (ks. Agrawala 1963 
[1953], 353-354; Cardona 1976, 238—239; Scharfe 1977, 106). Kyse on 
synkronisesta kieliopista ja kielijärjestelmän (langue) kuvauksesta — siis 
juuri siinä mielessä kuin Saussure (1962 [1916]) myöhemmin kirjoitti. 
Tämä osoittaa sen, että langue ei ole Saussuren tai häntä seuraavien 
strukturalistien keksintö vaan kielenkuvauksen perimmäinen kohde 
sen alkuajoista lähtien (ks. Robins 1990 [1967], 154-155; Kiparsky 1994, 
2917; Itkonen 2005, 4). Päninin kielioppia ei kirjoitettu talteen noin 
200 vuoteen vaan sen olemassaolo perustui puhtaasti oraaliseen perin- 
teeseen (ks. Agrawala 1903 [1953], 294). Tästä huolimatta länsimainen 
kielitiede on Kiparskyn (1994, 2918) mukaan ottanut vaikutteita Päninin 
kieliopista alusta lähtien ja tämä jatkuu vieläkin. Esimerkiksi 1800-lu- 
vun historiallisten kielitieteilijöiden käyttämä morfologinen analyysi pe- 
rustuu Päninin kielioppiin (mp.; ks. myös Bloomfied 1970 [1929], 221; 
Scharfe 1977, 115). 

Päninin kielioppi osoittaa vääräksi sellaiset näkemykset, joiden mu- 
kaan kielentutkimus ei olisi mahdollista ilman kirjoitusjärjestelmää (ks. 
Olson 1996 [1994], 68, 258, 277) tai että kielen (Saussuren langue) erot- 


62 Tarkka määrä vaihtelee sen mukaan, mitkä säännöistä lasketaan yksittäisiksi säännöiksi. 
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taminen puheesta (Saussuren parole) johtuisi kirjoitetun kielen vaiku- 
tuksesta (ks. Harris 1980, 4-6). Vaikka kirjoitetun kielen tutkimus olisi- 
kin vaikuttanut puhutun kielen tutkimuksen metodeihin, on kirjoitetun 
kielen tutkimus ottanut vaikutteita puhutun kielen tutkimuksesta jo 
ennen kuin puhutun kielen tutkimus on ottanut vaikutteita kirjoitetun 
kielen tutkimuksesta. Vaikutuksen resiprookkisuus on osoitus siitä, että 
kirjoitetun ja puhutun kielen tutkimuksen metodologialla on sama pe- 
rusta. Tämä taas johtuu tutkimuskohteiden perimmäisestä samuudesta. 
Paninin kielioppi osoittaa vääriksi myös sellaiset näkemykset, joiden 
mukaan jatkumoluonteisen puheen analysoiminen diskreeteiksi enti- 
teeteiksi olisi kirjoitetun kielen vaikutusta (ks. Harris 1980, 8-11; Dufva 
2000, 173-175), sillä kieliopin lisänä on kolme muuta tekstiä, joista 
aksarasamamnaya (tai siva-sittras) luettelee ja luokittelee puhutun kie- 
len foneemit niiden ominaisuuksien mukaan (Cardona 1976, 209-210; 
Kiparsky 1994, 2922—2923). Jatkumoluonteisen puheen analysoiminen 
diskreeteiksi yksiköiksi ei siis vaadi kirjoitettua kieltä tai ole sen seuraus 
vaan osoitus ihmisen taipumuksesta kategorisoida (ks. Boas 1964 [1911], 
121) — tässä tulee hyvin esiin kielentutkimuksen ja kielenoppimisen vä- 
linen yhteys. 

Abercrombie (1967, 1-3) tekee eron kielen (language) ja kielen ilmene- 
mismuodon (medium) välille. Kielen ilmenemismuoto ei Abercrombien 
näkemyksen mukaan ole kieltä vaan ainoastaan väline kielelle. Kielitiede 
on tiede, joka tutkii ensisijaisesti kieltä, mutta tähän on laskettava mu- 
kaan myös kielen ilmenemismuoto itsessään. Kuten Romaine (1982, 18) 
toteaa, kirjoitetun kielen tutkimus tuottaa tietoa ei ainoastaan kielestä 
itsestään vaan myös kirjoitetusta kielestä ilmenemismuotona. Puhutun 
ja kirjoitetun kielen takana on yhteinen ydin, mutta ne ovat riittävän eri- 
laisia ollakseen itsenäisiä tutkimuskohteita, minkä todistaa jo kirjoitetun 
ja puhutun kielen välisen suhteen suhteellisen pitkä tutkimushistoria. 
Esimerkiksi Akinnason (1982) mukaan kirjoitetun ja puhutun kielen 
välistä suhdetta on tutkittu ainakin 1920-luvulta lähtien, alussa ensisi- 
jaisesti vertailemalla eroja sanamäärissä. Syntaksin ja semantiikan tut- 
kimus kehittyi kuitenkin suurin piirtein samanaikaisesti sanamäärien 
tarkastelun kanssa, vaikka ajallinen pääpaino tutkimuksella lieneekin 
vuosisadan jälkimmäisellä puoliskolla (mts. 99—104.). Viimeistään 
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1980-luvulla tutkimus alkoi laajentua diskurssin (tai tekstien) tutkimuk- 
seen (ks. esimerkiksi Tannen toim. 1982). 

Kokonaisvaltainen kielentutkimus kattaa sekä puhutun että kirjoite- 
tun kielen tutkimuksen. Toisinaan näkee vielä väitettävän, että kielitiede 
on keskittynyt tutkimaan vain joko kirjoitettua tai puhuttua kieltä ja että 
se tästä syystä on rajoittunutta. Linell (1982, 31) väittää, että nykyaikainen 
kielitiede on keskittynyt tutkimaan ainoastaan kirjoitettua kieltä, kun 
taas Coulmas (1989, iix) esittää aivan päinvastaista ja puhuu kirjoituk- 
sen tutkimuksen laiminlyömisestä. Tällaisiin julistuksiin tulisi toden- 
näköisesti suhtautua vähintäänkin varauksella, koska ne on aina tehty 
tietystä perspektiivistä tietyt intressit mielessä. Mikäli kielitieteen histo- 
riaa tarkastellaan kokonaisuutena, jakaantuu puhutun ja kirjoitetun 
kielen tutkimus siten, että toinen esiintyy lähes aina ensisijaisena tut- 
kimuskohteena aikakaudesta ja tutkimussuunnasta riippuen. Näin 
Romaine (1982, 20) saattoi täysin perustellusti kirjoittaa, että sosioling- 
vistisiä metodeja ei vielä 1980-luvulla ollut juurikaan sovellettu kirjoite- 
tun kielen tutkimukseen. Kun näin sitten tapahtui, syntyi kokonainen 
tieteenala eli historiallinen sosiolingvistiikka (ks. Nevalainen & Raumo- 
lin-Brunberg 2012). 

Tämän luvun näkökulmasta katsottuna puhutun ja kirjoitetun kielen 
vuorovaikutuksen perusteella voidaan olettaa, että puhutussa kielessä 
meneillään oleva muutos heijastuu viipeellä myös kirjoitettuun kieleen, 
sillä kirjoitettu kieli on yleensä konservatiivisempaa kuin puhuttu kieli. 
Samalla se kuitenkin antaa myös mahdollisuuden olettaa, että muutos 
ei toteudu sellaisenaan. 


Suomen possessiivisuffiksi 


Omistusliite eli possessiivisuffiksi on suomen kielelle tyypillinen ilmiö 
(Karlsson 1998, 164-165; Miestamo 2006, 49; WALS 58A), jonka juuret 
ulottuvat todennäköisesti aina kantauraliin saakka (Mark 1925; Itkonen 
1955; Ikola 1992, 176). Suomen kirjakielen isänä pidetty Mikael Agricola 
rakensi suomen kirjakielen Turun ja Viipurin seudun murteiden va- 
raan, mutta hänen seuraajansa siirsivät painopisteen hämäläismurtei- 
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siin (Tuomi 1986, 22). Ehkä juuri tästä syystä omistusmuotojen käyttö 
hämäläismurteissa on lähimpänä kirjakielen kantaa (Ikola 1992, 193). 
Vastaavasti kauimpana kirjakielen kannasta lienevät itämurteet. Yhdek- 
si syyksi possessiivisuffiksin käytön vähenemiselle onkin esitetty juuri 
itämurteiden vaikutuksen vahvistuminen (Ikola 1992, 193; Yli-Vakkuri 
1993, 85). Toisaalta etenkin Helsingin puhekielen osalta yhdeksi tekijäk- 
si on nostettu myös ruotsin kielen analyyttinen vaikutus (Karlsson 1975, 
62; Paunonen 1995, 526). 


POSSESSIIVISUFFIKSI KIRJAKIELESSÄ JA MURTEISSA 

Kirjakielessä omistussuhdetta ilmaistaan possessiivisuffiksisilla omistus- 
muodoilla, joihin saattaa liittyä persoonapronominin genetiivimuoto 
(Setälä 1966 [1880], 87-88; Ikola 2001, 74-77). Lindenin (1959, 294-295) 
mukaan niissä tapauksissa, joissa suffiksi viittaa lauseen subjektiin tai 
subjektiin verrattavaan lauseenjäseneen (= refleksiivinen käyttö), jää per- 
soonapronomini pois (esimerkiksi rikoin mukini). Mikäli suffiksi taas viit- 
taa muuhun kuin lauseen subjektiin (= ei-refleksiivinen käyttö), voidaan 
I. ja 2. persoonan pronomini jättää pois, ellei sillä ole painoa (esimerkiksi 
sait kirjani). Kolmannen persoonan pronomini on sitä vastoin aina lii- 
tettävä omistusmuodon oheen (esimerkiksi Teppo rikkoi hänen [ei siis 
Tepon] mukinsa). Linden toteaa, että kirjakielessä 3. persoonan possessii- 
visuffiksi ei ole merkitystehtävältään yhtä itsenäinen kuin 1. ja 2. persoo- 
nan possessiivisuffiksi, sillä se kykenee ilmaisemaan omistajan ainoas- 
taan viitatessaan lauseen subjektiin, kun taas 1. ja 2. persoonan posses- 
siivisuffiksi kykenee tähän kaikissa tapauksissa. Lindenin mukaan tätä 
piirrettä ei niinkään tavata murteissa, vaan hän laskee sen kuuluvaksi 
ensijaisesti kirjakieleen. Paunonen (1995, 505) toteaa Helsingin puhe- 
kielen omistusmuotoja käsittelevässä artikkelissaan, että koska 1. ja 
2. persoonan persoonapronominit eivät ole välttämättömiä merkityksen 
kannalta, ovat kieliopit ja kielioppaat suositelleet jo pitkään pelkän suf- 
fiksin käyttöä. Murteissa tilanne näyttäisi kuitenkin toisenlaiselta, sillä 
myös 1. ja 2. persoonan omistusmuoto saa usein vahvikkeekseen persoo- 


63 Kiurun (1996) tutkimuksen mukaan possessiivisuffiksin käyttö on ollut kaikkein yleisintä ylä- ja alasata- 
kuntalaismurteissa sekä Porin seudun murteissa. 
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napronominin niissä tapauksissa, missä omistusliite ei viittaa lauseen 
subjektiin (mp.; myös Linden 1959, 299; Nuolijärvi 1986, 160). Linden 
(1959, 299) päättelee, että tämmöisissä tapauksissa saattaa olla kyse sii- 
tä, ettei pelkkää possessiivisuffiksia koeta riittävän ilmaisuvoimaiseksi. 
Näiden tapausten lisäksi on vielä mainittava se seikka, että possessiivi- 
suffiksia ei käytetä silloin, kun omistusmuoto ilmaisee perhettä, yhtei- 
söä tai asuinpaikkaa vaan tällöin riittää pelkkä persoonapronominin 
genetiivimuoto (esim. meidän äiti, Setälä 1966 [1880], 88; Hakanen 
2000; Ikola 2001, 75). Tämä sääntö näyttää olevan sama sekä kirjakie- 
lessä että murteissa. 

Murteet eivät tietenkään ole yhtenäisiä. Yllä on todettu, että todennä- 
köisesti kauimpana kirjakielen kannasta ovat itämurteet. Esimerkiksi 
Latvalan (1899, 40—41) mukaan Pohjois-Savon murteessa suffiksin pois- 
jättö on huomattavasti yleisempää kuin kirjakielessä (esimerkiksi Onko 
tämä minun harava?). Ikolan (1992, 187) katsauksessa suffiksin poisjättö 
on ylipäätään moninkertaisesti yleisempää itämurteissa kuin länsimur- 
teissa. Toisaalta Järvisen (2011) tutkimuksen mukaan liitteettömyys ei 
ole tuntematon ilmiö länsimurteissakaan ainakaan hämäläismurteiden 
osalta. Markin (1925, 241) mukaan ilmiö tunnetaan mm. Satakunnan, 
Etelä-Hämeen, Pohjois-Savon ja Kaakkois-Suomen alueilla puhutuista 
murteista. 


POSSESSIIVISUFFIKSIN KEHITYS PUHUTUSSA KIELESSÄ 

Possessiivisuffiksin kehitystä on tutkittu etenkin sosiolingvistisessä 
kontekstissa (mm. Turunen 1982; Nuolijärvi 1986; Paunonen 1995; 
Mitrunen 2005; Järvinen 2011). Yleinen mielipide tuntuu olevan, että 
possessiivisuffiksi elää puhekielessä rajua muutoskautta ja on väisty- 
mässä (esimerkiksi Kangasmaa-Minn 1986; Ikola 1992; Paunonen 
1995). Esimerkiksi Paunonen (1995, 514) arvioi — kuten jo todettiin -, 
että possessiivisuffiksi katoaisi Helsingin puhekielestä 2040-luvun 
tienoilla. Toisaalta vastakkaisiakin näkemyksiä on esitetty. Yli-Vakkuri 
(1993, 83-84) ei usko, että omistusliitteiden produktiivinen käyttö tulisi 
suomen kielestä katoamaan, vaan näkee niiden vaihtelevassa käytössä 
erityyppisiä tekstistrategioita. Hurtta (1999, 88-91) puolestaan kritisoi 
Paunosen (1995) omistusmuotojärjestelmää koskevaa artikkelia siitä, 
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että aineistosta on rajattu pois juuri ne tapaukset, joissa possessiivisuf- 
fiksin asema on vahva, eli lauseenvastikkeet, nominaalirakenteet, adver- 
bit ja toisen persoonan omistusmuodot. Yhtä kaikki, possessiivisuffiksin 
kirjakielen mukaisessa hallinnassa on havaittu puutteita myös ylioppi- 
lailla ja lukioikäisillä (Leino 1992; Tiainen 2008). Enteilevästi Kangas- 
maa-Minn (1986) toteaakin, että possessiivisuffiksi edustaa uhanalaista 
kielellistä ainesta, ja Ikola (1992, 176) kirjoittaa yleiskielen normijär- 
jestelmän rappeutumisesta. Ennuste possessiivisuffiksin katoamisesta 
myös kirjoitetusta kielestä perustuu muun muassa näihin tutkimuksiin 
sen asemasta puhekielessä. 

Helsingin puhekielessä possessiivisuffiksia ovat tarkastelleet ainakin 
Paunonen (1995 [1982]; 2005) ja Nuolijärvi (1986). Näistä Paunosen 
(1995 [1982]) tutkimus on näennäisaikainen tutkimus Helsingin puhe- 
kielestä ja sen kehittymisestä. Omistusmuotojen osalta tutkimuksessa 
esitetään, että suffiksiton mun kirja -tyyppi on valtaamassa alaa varsinkin 
nuorilla puhujilla ja leviämässä ei-refleksiivisestä asemasta refleksiivi- 
seen asemaan. Paunonen (mts. 215) kuitenkin toteaa, ettei kyse ole uu- 
desta ilmiöstä, sillä myös vanhemmilla puhujilla esiintyy sekä minun 
kirja- että mun kirja -tyyppiä, ja että liitteettömyys on täten kuulunut 
jo vuosisadan vaihteessa hahmottuvaan puhekieleen. Mun kirja -tyypin 
yleistyminen saa tukea myös Nuolijärven (1986) tutkimuksesta, jossa 
tarkastellaan Helsinkiin muuttaneiden eteläpohjalaisten ja pohjoissavo- 
laisten kieltä heidän asuttuaan Helsingissä 10-20 vuotta. Tutkimuksen 
perusteella mun kirja -tyyppi on tunkeutunut muuttajien kieleen ja myös 
refleksiiviseen asemaan, jossa molemmissa murteissa tavataan ainoas- 
taan kirjani-tyyppiä (mts. 166). Nuolijärvi (1986, 161-162, 166-168) kui- 
tenkin huomauttaa, että itse tyyppi ei ole muuttajien murteelle vieras, 
sillä pohjalaismurteissa mun kirja- tyyppiä tavataan ei-refleksiivisessä 
asemassa, ja savolaismurteissa ei-refleksiivisessä asemassa käytössä on 
minun kirja -tyyppi. Paunosen (1995) reaaliaikainen tutkimus osoittaa, 
että aikaisemmat havainnot mun kirja -tyypin vahvenemisesta pitävät 
paikkansa. Esimerkiksi 1. persoonassa mun kirja -tyyppi on vahvistunut 
molemmissa asemissa noin 20 prosenttiyksikköä kaikki ikäluokat mu- 
kaan laskettuna (mts. 508). Nuorilla mun kirja -tyyppi on jo hallitseva 
molemmissa asemissa (mts. 511). 
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Tampereen puhekielessä possessiivisuffiksia ovat tarkastelleet ainakin 
Turunen (1982), Mitrunen (2005) ja Järvinen (2011). Lähempään tarkas- 
teluun otamme tässä Järvisen reaaliaikaisen tutkimuksen Vaskiveden 
murteesta (2011). Tutkimuksen perusteella Helsingin puhekielestä 
tehdyt havainnot saavat ainakin jossain määrin tukea, sillä 1990-luvun 
vaskiveteläisten koululaisten ryhmässä liitteetön mun kirja -variantti on 
edennyt refleksiiviseen asemaan 1. persoonassa.*4 Toisaalta kokonaisuu- 
dessaan koululaisilla on vähemmän liitteettömiä muotoja kuin hiukan 
vanhemmilla nuorilla, joten Järvinen päättelee liitteettömien muotojen 
lisääntymisen taittuneen. Tätä tukee myös se havainto, että keski-ikäisil- 
lä liitteellisten muotojen määrä on lisääntynyt (mts. 94-96, 105-106, 
113). Järvinen tarkastelee tutkimuksessaan myös muita omistusliitteel- 
lisiä muotoja kuten verbien nominaalimuotoja (esimerkiksi juostessani) 
sekä omistusliitteellisiä adverbeja (esimerkiksi tahallani). Näissä tapauk- 
sissa omistusliitettä ei siis voi jättää pois eikä vaihtelua täten havaita. 
Järvisen (2011, 107) mukaan tällaisia muotoja oli vanhassa Vaskiveden 
aineistossa vanhoilla ja nuorilla 18 prosenttia kaikista omistusmuodoista 
ja keski-ikäisillä peräti 45 prosenttia. Uudessa Vaskiveden aineistossa 
nuorilla vaihteluttomia muotoja on 39 prosenttia, keski-ikäisillä 35 pro- 
senttia ja koululaisilla noin 18 prosenttia kaikista omistusmuodoista. 
Mistään vähäisistä määristä ei siis ole kysymys, vaikkakin ikäryhmittäi- 
nen vaihtelu näyttäytyykin melko suurena. 

Näistä tutkimuksista on syytä esittää joitakin huomioita. Hurtta 
(1999, 88-91) on kritisoinut Paunosen (1995) tutkimusta siitä, että ai- 
neisto on rajattu siten, että jo rajauksen perusteella on odotuksenmu- 
kaista, että possessiivisuffiksit näyttäisivät olevan katoamassa. Hurtta 
(mts. 91) viittaa Makkonen-Craigin (1996) tutkimukseen, joka ei tukisi 
sitä ajatusta, että possessiivisuffiksi olisi katoamassa kokonaan. Yllä on 
nähty, kuinka Järvisen tutkimuksessa vaihteluttomien omistusliitteellis- 
ten muotojen määrä on varsin suuri. On selvä, että hypoteettinen pos- 
sessiivisuffiksin katoaminen suomen kielestä (ks. Karlsson 1975) voi 
tapahtua vasta sitten, kun suffiksi katoaa kaikista asemista — myös vaih- 
teluttomista asemista. Tähän ei riitä liitteettömien muotojen leviäminen 


64 Järvinen (2011, 105) tosin huomauttaa, että refleksiivisiä muotoja on kaikkiaan melko vähän. 
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refleksiiviseen asemaan 1. persoonassa. On kuitenkin huomattava, että 
Paunosen (1995) tutkimus käsittelee ainoastaan Helsingin puhekieltä, ei 
suomen puhekieltä kokonaisuudessaan. Tässä mielessä on vähintäänkin 
hämäävää, että Paunonen silti puhuu koko puhesuomen kattavasta 
muutoksesta — mistä Hurtta Paunosen tutkimusta osuvasti kritisoikin 
(1999, 88). Toisaalta on muistettava, että vaihtelun tutkiminen on täysin 
mahdotonta, ellei ole vaihtelua, mitä tutkia. On kuitenkin syytä pitää 
erillään aluepuhekielen tutkimus ja koko suomen kieltä ja sen erilaisia 
käyttöjä kattavat ennusteet (muutoksen ennustamisesta tarkemmin, ks. 
Laasanen 2016). 

Sekä Paunosen (1995 [1982]; 1995) että Nuolijärven (1986) tutkimuk- 
sissa Helsingin puhekielen tietynlaiseksi kuriositeetiksi esitetään mun 
kirja -tyypin esiintyminen refleksiivisessä asemassa. Mun ei kuitenkaan 
ole erillinen possessiivipronomini vaan pronominin minun hyvin ylei- 
nen pikapuhemuoto, jolle on monia vastineita myös murteissa, aivan 
samoin kuin mua on partitiivimuotoisen minua-sanan pikapuhemuoto. 
Järvinen (2011) puhuukin omassa tutkimuksessaan yleisesti minun kirja 
-tyypistä mutta mainitsee erikseen (mts. 73) koululaisten käyttävän yksin- 
omaan pronominin mun varianttia. Mikäli tyypit minun kirja ja mun 
kirja asetetaan rinnakkain, kyse ei siis ole siitä, että minun kirja -tyypin 
rinnalle on tullut uusi tyyppi, vaan siitä, että possessiivipronomini on 
redusoitunut muotoon mun. Tällä on loppujen lopuksi vain vähän teke- 
mistä possessiivisuffiksin kehityksen kanssa. 

Yllä on todettu, että possessiivisuffiksin kirjakielen mukaisessa hal- 
linnassa on havaittu puutteita mm. ylioppilaskirjoituksissa (esimerkiksi 
Leino 1992). Yli-Vakkuri (1993, 78) toteaa, että virheitä tulee sitä enem- 
män, mitä vähemmän kielenkäyttäjä on joutunut tekemisiin kirjakielen 
kanssa. Paunonen (1995, 527) arvelee, että omistusliitteiden kirjakielen 
mukaista oikeaoppista käyttöä saattaa olla jopa vaikeata opettaa oppilail- 
le, joiden omaan kieleen omistusliitteet eivät yksinkertaisesti kuulu. 
Oppilaille opetetaan kuitenkin aika paljon sellaisia asioita, jotka eivät 


65 Vrt. Yli-Vakkuri (1992, 84-85): "Jos omistusmuotojen vaihtelulla on jonkinasteinen vakiintunut teks- 
tuaalis-pragmaattinen funktio, jos se toisin sanoen palvelee tekstistrategiaa, minusta on vaikea uskoa, 
että omistusliitteiden produktiivinen käyttö tulisi katoamaan suomen kielestä — —”. 
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(vielä) kuulu heidän elämäänsä; ei ole mitään syytä olettaa, että posses- 
siivisuffiksi olisi tässä joukossa poikkeus (ks. myös Hurtta 1995, 89-91). 
Kyse ei ole kuitenkaan ainoastaan omistusjärjestelmän hallinnasta, 
vaan yleisemmin kielen sääntöjen tai normien natiivihallinnasta, jota ai- 
nakin suomen kielen osalta on tähän mennessä tutkittu auttamattoman 
vähän (ks. esimerkiksi Pajunen, Itkonen & Vainio 2015). Kuten Pajunen 
ja muut (mts. 160) toteavat, yleinen mielipide lienee se, että kaikki hallit- 
sevat äidinkielensä riittävästi. Tämä oletus kumpuaa kuin huomaamatta 
näkemyksestä, jossa jokaiselle kielenkäyttäjälle oletetaan yhtenäinen, 
homogeeninen kielioppi tai kompetenssi, jota tutkii psykologian alaan 
kuuluva kielioppiteoria. Hypoteettinen, kaikkia puhujia yhdistävä homo- 
geeninen kompetenssi on tässä näkemyksessä teoreettinen välttämät- 
tömyys, joka mahdollistaa psykologisen ulottuvuuden saavuttamisen. 
Ongelmana on se, ettei tälle oletukselle ole perusteita. Tämä käy ilmi, 
kun kielen ajatellaan olevan yhdentyyppistä tietoa. Puhuja esimerkiksi 
tietää, että suomen kirjakielessä lauseen subjektiin viittaavan suffiksin 
yhteyteen ei liitetä possessiivipronominia, tai ei tiedä.** Mikäli puhuja 
tietää tämän, hän ei tee virhettä. Mikäli puhuja ei tiedä tai muista tätä, 
hän tekee virheen (mikäli ei arvaa oikein). Mikäli toinen puhuja tietää 
tämän, mutta toinen puhuja ei, eroavat nämä kaksi puhujaa toisistaan 
kirjakielen hallinnan suhteen. Toinen puhuja kuuluu siihen joukkoon, 
joka tekee ylioppilaskirjoituksissa virheen ja joka saa aikaan huolen 
yleiskielen normijärjestelmän rappeutumisesta, toinen puhuja taas ei. 
Kirjakielen säännöt ovat kielen sääntöjä aivan samoin kuin murtei- 
denkin säännöt. Se, että murteet eivät tunne pronominien liikakäytön 
välttämisperiaatetta (ks. Paunonen 1995, 505), ei tee niistä jollakin olen- 
naisella tavalla erilaisia kuin kirjakieli. Molemmat sisältävät sääntöjä, 
mutta sääntöjen sisältö saattaa olla hiukan erilainen. Tässä onkin asian 
ydin: kaikki puhe virheistä ja puutteista ja normijärjestelmien rapautu- 
misesta kertoo siitä, että kieli todellakin on yhdentyyppistä tietoa, jonka 
hallinnan suhteen puhujat varioivat. Variaation ulkoistaminen perfor- 


66 Jackendoff (2002, 28) väittää täysin ristiriitaisesti, että puhujilla ei ole mitään tällaista tietoa, vaikka 
hänen oma esityksensä perustuu kokonaisuudessaan tällaisen tiedon olemassaololle ja käytölle 
(ks. Itkonen 2008, 16). 
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manssiin on teoreettisista lähtökohdista tehty ad hoc -ratkaisu, jonka 
avulla tutkimuskohteesta saadaan halutunlainen (vrt. vaihteleva kompe- 
tenssi, Ellis 2012). 

Vaikka possessiivisuffiksin käytössä onkin havaittu selvää muutosta eri 
tutkimuksissa, näyttäisi näkemys ”dramaattisesta” ja ”rajusta” muutos- 
vaiheesta sittenkin perustuvan yksittäisiin esimerkkeihin. ”Minä tahdon 
minun pillerit!”, kirjoittaa Kangasmaa-Minn (1986, 7); Paunonen (1995, 
501) puolestaan viittaa ”— — erään kaupanalan keskusjärjestön meidän 
merkki -iskulause[eseen]”. On kuitenkin kysyttävä, kuinka dramaattisesta 
muutoksesta voi olla kyse, jos liitteettömyys on kuulunut jo vuosisadan 
vaihteessa hahmottuvaan Helsingin puhekieleen (Paunonen 1995 
[1982], 215), jos liitteettömyydestä on merkkejä jo vanhoissa murre- 
aineistoissa (Järvinen 2011) tai jos jo vuonna 1966 Y. Lumio on ollut 
huolissaan omistusliitteiden poisjätöstä (Paunonen 1995, 501). Yksittäi- 
set esimerkit voivat olla tietoinen tai tiedostamaton keino korostaa jon- 
kin asian merkitystä, mutta loppujen lopuksi ne ovat ainoastaan yksit- 
täisiä esimerkkejä. 

Kangasmaa-Minn (1986, 7) toteaa kirjoituksessaan, että possessiivi- 
suffiksi on taipuvainen katoamaan, koska se sijaitsee sanassa viimeisenä 
ja on toisinaan redundantti, kuten ilmauksessa minun kalani. Redun- 
danttisen, sanassa viimeisenä esiintyvän aineksen poisjättö on kielen 
ekonomisuuden kannalta täysin rationaalista. Redundantit esiintymät 
ovat juuri niitä vaihtelevia tapauksia, joissa possessiivisuffiksin käytön 
katsotaan vähentyneen. Puhtaasti ekonomisuuden näkökulmasta on siis 
odotuksenmukaista, että suffiksin käyttö vähenee. Toisaalta kokeellinen 
tutkimus osoittaa, että possessiivijärjestelmän kaltaiset kongruenssi- 
systeemit" eivät edusta täysin redundanttia tietoa vaan niillä on selvä 
funktio: ne nopeuttavat kielen prosessointia sitomalla yhteenkuuluvat 
ainekset yhteen (ks. Vainio, Hyönä & Pajunen 2008). Kuten yllä on jo 
todettu, suffiksi ei voi kuitenkaan kadota suomen kielestä, ennen kuin 
se katoaa myös ei-redundanteista asemista. 


67 Kongruenssisysteemejä ovat mm. subjekti- ja objektikonjugaatio sekä omistus- ja pääsana-attribuutti- 
kongruenssi. 
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POSSESSIIVISUFFIKSIN KAYTON KEHITYS MODALITEETISTA 
TOISEEN 

Havainnot possessiivisuffiksin käytön vähenemisestä perustuvat ensisi- 
jaisesti puhuttuun kieleen. Kirjoitetusta kielestä on tarjolla pääsääntöi- 


sesti yksittäisiä esimerkkejä 
1995), kuten jo todettiin. Yleinen mielipide lieneekin se, että kyse on 


(ks. esimerkiksi Ikola 1992; Paunonen 


puhutussa kielessä alkaneesta muutoksesta, joka hiljalleen levittäytyy 
kirjoitettuun kieleen (vrt. Tiainen 2008). Tämä on kuitenkin vain yksi 
mahdollinen vaihtoehto yhteensä neljästä teoreettisesti mahdollisesta 
vaihtoehdosta. 

Ensimmäisen vaihtoehdon mukaan muutos on siis alkanut puhutus- 
sa kielessä, josta se on hiljalleen levinnyt kirjoitettuun kieleen. Liitteettö- 
myys kirjoitetussa kielessä voi liittyä puhekielen tavoitteluun, huolimat- 
tomuuteen tai puutteelliseen sääntöjen hallintaan (ks. Varjonen 1996). 
Koska kirjoitettu kieli muuttuu yleensä hitaammin kuin puhuttu kieli, 
voisi ajatella, että kirjoitetun kielen tutkimus paljastaisi jonkin verran 
puhutun kielen tilannetta varhaisemmassa vaiheessa olevan muutoksen. 
Toisin sanoen myös kirjoitetussa kielessä tulisi havaita liitteettömyyden 
vahvistumista mutta ei välttämättä niin paljon kuin puhutussa kielessä. 

Toisen vaihtoehdon mukaan muutos on alkanut kirjoitetussa kielessä, 
josta se on siirtynyt puhuttuun kieleen varsin nopeasti tai siten, että 
muutos on puhutussa kielessä äkillisesti kiihtynyt. Se, ettei liitteettö- 
myyttä ole havaittu kirjoitetussa kielessä johtuisi tässä vaihtoehdossa 
siitä, ettei aihetta ole tutkittu riittävän tarkasti. 

Kolmannen vaihtoehdon mukaan muutos on alkanut jokseenkin 
yhtäaikaisesti sekä puhutussa että kirjoitetussa kielessä. Tässä vaihto- 
ehdossa molemmissa kielen ilmenemistavoissa tulisi näkyä merkkejä 
liitteettömyyden vahvistumisesta, mutta tutkimuksen painopisteen olles- 
sa puhutussa kielessä tilanne näyttää siltä, kuin muutos olisi alkanut 
puhutussa kielessä. Tämän vaihtoehdon erottaminen ensimmäisestä 
vaihtoehdosta lienee hyvin hankalaa, mutta voisi ajatella, että tässä ta- 
pauksessa kirjoitetussa kielessä esiintyisi jonkin verran ensimmäistä 
tapausta enemmän merkkejä liitteettömyydestä. 

Ensimmäinen vaihtoehto lienee todennäköisin jo siitä syystä, että 
kyse on puhekielelle varsin tyypillisestä ilmiöstä ja tässäkin kirjoituk- 
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sessa on viitattu mun-muotoon persoonapronominin minun pikapuhe- 
muotona. Kaksi muuta ovat kuitenkin teoreettisesti mahdollisia. Se, 
ettei niitä yleensä edes tuoda esiin, kertoo siitä, miten vahvasti ensisijai- 
seksi puhuttu kieli mielletään — aivan kuin huomaamatta. Mukaan on 
kuitenkin otettava myös neljäs vaihtoehto, jonka mukaan muutos ei 
ulottuisikaan kirjoitettuun kieleen, ja siinä ei odotuksenvastaisesti näkyi- 
sikään merkkejä possessiivisuffiksin käytön vähenemisestä verrattaessa 
eriaikaisia aineistoja. Kirjoitetussa kielessä havaittavat yksittäiset merkit 
suffiksin poisjätöstä olisivat tällöin osoitus (pitkäkestoisesta) variaatiosta. 


Possessiivisuffiksi kirjoitetussa kielessä 


Possessiivisuffiksin käytön kehitys kirjoitetussa kielessä on käytännössä 
tutkimaton aihe. Kirjoitetun kielen osalta on esitetty vain yksittäisiä 
esimerkkejä ja huomioita, joiden mukaan puhutussa kielessä etenevä 
muutos on todennäköisesti leviämässä myös kirjoitettuun kieleen. Esi- 
merkiksi Ikolan (1992, 181) ennusteen mukaan possessiivisuffiksien 
käyttö vähentyy sanomalehtikielessä. Koska tutkimuksessamme on mu- 
kana 2000-luvun sanomalehtikorpuksia ja kirjoitelmia, voidaan Ikolan 
asettama ennuste testata. Mikäli esitetyt havainnot ja tehdyt ennusteet 
possessiivisuffiksin käytön vähenemisestä kirjoitetussa kielessä pitävät 
paikkansa, tulisi kirjoitetussa kielessä näkyä tästä selviä merkkejä. Mikä- 
li tällaisia merkkejä ei löydy, voidaan ennusteet laskea epäonnistuneiksi, 
missä tapauksessa on pohdittava epäonnistumisen syitä. Tutkimuksem- 
me taustana on siis yhtäältä puhutussa kielessä todettu muutos suffik- 
sien käytön vähentymisen suuntaan ja toisaalta huomiot ja ennusteet 
suffiksien käytön vähenemisestä kirjoitetussa kielessä. 

Koska tutkimuksemme käyttää massakorpuksia, eroavat tarkasteltavat 
yksityiskohdat ja kielenpiirteet tietyiltä osin aiemmista tutkimuksista. 
Esimerkiksi suffiksien käytön tarkastelu refleksiivisessä ja ei-refleksiivi- 
sessä asemassa, joka on tärkeässä asemassa useissa puhutun kielen 
tutkimuksissa, ei ole mahdollinen aineiston koon vuoksi. Toisaalta tut- 
kimuksessa tarkastellaan yksityiskohtaisemmin mm. suffiksien käytön 
kehitystä sanaluokittain ja verbimuodoittain. 
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Aloitamme esittelemällä aineistot ja tutkimusmenetelmät, minkä jäl- 
keen luomme yleiskatsauksen possessiivisuffiksien esiintymiin ja vaihte- 
luun eri vuosikymmeninä. Tämän jälkeen tarkastelemme possessiivisuf- 
fiksien käyttöä ja kehitystä sanaluokittain; verbejä analysoimme myös 
niiden funktioiden kautta. Lisäksi tarkastelemme suffiksien kehitystä sel- 
laisten niin sanottujen indeksisanojen yhteydessä, jotka ilmaisevat luon- 
taisesti tai juridisesti omistettavia käsitteitä. Viimeiseksi katsomme vielä 
erikseen kolmannen persoonan tunnuksen vaihtelua ja muutosta. Lo- 
puksi kokoamme tulokset ja pohdimme ennusteiden paikkansapitävyyttä. 


AINEISTO JA SEN KOODAUS 

Tutkimuksen aineistona on sähköisiä, eri vuosikymmeniä edustavia kor- 
puksia, joista on poimittu kaikki possessiivisuffiksilliset muodot seuraa- 
van jaottelun mukaan: 1) yksikön 1. persoonan suffiksi, 2) monikon 
1. persoonan suffiksi, 3) yksikön 2. persoonan suffiksi, 4) monikon 
2. persoonan suffiksi sekä 5) kolmannen persoonan suffiksit tunnuksen 
tyypin mukaan jaotellen (nsa, nsä, vokaalin pidentymä+n). Kolmannen 
persoonan alaluokittelun syynä on pyrkimys tutkia erikseen, a) ovatko 
variantit (Vn/nsV) vapaassa vaihtelussa vai eivät kaikissa niissä tapauk- 
sissa, joissa molemmat periaatteessa ovat mahdollisia (kuten taloaan tai 
taloansa), ja toisaalta, b) onko varianteissa produktiivisuuseroja. Ajalli- 
sesti aineistoa on viimeiseltä 70 vuodelta ja se edustaa sekä sanomalehti- 
kieltä että noin 18—20-vuotiaiden nuorten kieltä (ylioppilasainekirjoi- 
telmia). Lisäksi 2000-luvun kieltä on sekä alakoulun oppikirjoista, 
peruskoululaisten ja nuorten aikuisten Unelmakirjoitelmista sekä fik- 
tiosta. Pyrimme siten arvioimaan possessiivisuffikseja sekä ajallisesti 
että eri tekstilajeista ja -tyypeistä. Aineisto esitellään yksityiskohtaisesti 
tämän teoksen johdannossa. 

Sanomalehtiaineistona on: a) Lauseopin arkiston (LA) materiaali, 
joka edustaa 1970-luvun sanomalehtikieltä mutta lisäksi kirjoitettua 
yleiskieltä Oulun korpuksen jakauman mukaan (ks. Saukkonen 1982). 
Otoksena on 20000 tekstisanaa (sanomalehdet, aikakauslehdet sekä 
ei-fiktiivinen kirjallisuus). b) Helsingin Sanomien vuosien 2001-2002 
aineisto eli HS2000-korpus (Pajunen & Virtanen 2002a). Korpuksessa 
on noin 23,4 miljoonaa tekstisanaa. Lisäksi on c) miljoonan tekstisanan 
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otos Savon Sanomien vuoden 2001 aineistosta eli SS2000-korpuksesta 
(n. 8 miljoonaa tekstisanaa, Pajunen & Virtanen 2002b). Kirjoitelmakor- 
pus (Pajunen 2004) on koostettu vuosina 1948-2003 ilmestyneistä vali- 
koitujen ylioppilasaineiden kokoomateoksista ja sen sanamäärä on yh- 
teensä miljoona tekstisanaa. Kirjoitelmakorpuksesta on poimittu kolme 
eriaikaista otosta: 1948-1958 (144752 tekstisanaa), 1968-1978 (272810) 
ja 1988-1998 (215 850). Otoksiin viitataan taulukoissa useimmiten ly- 
henteillä 1950-luku, 1970-luku ja 1990-luku. Paikoin on käytössä koko 
miljoonan sanan kirjoitelma-aineisto. Kirjoitelmakorpus on koostettu 
ajallisin kriteerein ja se on sisällöllisesti samantapaista, vastaavasti 
1970-luvun ja 2000-luvun lehtikieli ovat vertailtavissa. Lisäksi on vajaan 
puolen miljoonan tekstisanan aineisto, josta puolet koostuu 2000-luvun 
ensimmäisellä vuosikymmenellä käytössä olleista alakoulun eri oppi- 
aineiden oppikirjoista (ks. Jaakola 2004) ja puolet fiktiivisestä kirjalli- 
suudesta (yht. 417 919 tekstisanaa). Joitain viittauksia tehdään Lauseopin 
arkiston murreaineistoihin, joista otoksena on 200 000 tekstisanaa (ks. 
Pajunen & Palomäki 1984). Kaikki aineiston osiot Lauseopin arkiston 
materiaalia lukuun ottamatta on koodattu samalla jäsentimellä (funktio- 
naaliseen dependenssikielioppiin perustuva FDG-jäsennin, ks. Vouti- 
lainen 2002), ja aineiston joka osiosta on poimittu kaikki possessiivi- 
suffiksilliset esiintymät samalla ContextMill-ohjelmalla (ks. Virtanen & 
Pajunen 2001). LA:n aineisto on koodattu manuaalisesti mutta se on 
moneen kertaan ja monella tapaa tarkistettuna luotettava. Kehitykselli- 
nen aineisto 2010-luvulta — eli peruskoululaisten ja nuorten aikuisten 
kirjoitelmista koostuva Unelma-aineisto — on mukana vertailussa vain 
suppeasti, koska sitä ei ole koodattu FDG-jäsentimellä muun aineiston 
tapaan. Unelma-aineistossa ei ylipäätään ole morfologista koodausta ja 
lisäksi sanamäärä ei ole kaikkien ikäryhmien osalta riittävä (aineisto esi- 
tellään tarkemmin tämän teoksen johdantoluvussa). 

Automaattiset poimintaohjelmat sekä ali- että yligeneroivat jossain 
määrin. Puuttuvia muotoja ei pysty löytämään mutta kaikki yligeneroitu- 
neet on pyritty poistamaan tai niiden koodaus korjaamaan. Ohjelma 


68 Oppikirja-aineiston on koonnut Mari Jaakola (2004) pro gradu -tutkielmaansa ja se on liitetty Kirjoi- 
telma-korpukseen FDG-analysoituna. Kiitämme Mari Honkoa aineiston käyttöluvasta. 
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esimerkiksi poimii jonkin verran illatiivimuotoisia sanoja possessiivi- 
suffiksillisina. Lisäksi on ollut tarpeen oikaista paikoin sanaluokitusta 
ja esimerkiksi selvästi kiteytyneet substantiivi- ja pronominimuodot on 
korjattu adverbeiksi (tavallaan, mielellään, kohdallaan; sinänsä, yksinään). 
Jonkin verran löytyy satunnaisia muita sanaluokkavirheitä. Esimerkiksi 
muoto elämääni on korjattu verbimuodosta substantiivimuodoksi, koska 
konteksti paljastaa, että kyseessä ei ole tyyppi elämääni elämää vaan elä- 
määni kuuluu. Aineistoon on voinut jäädä virheitä, mutta ne eivät toden- 
näköisesti vähennä tilastollista luotettavuutta. 


YLEISKATSAUS POSSESSIIVISUFFIKSIEN ESIINTYMIIN JA 
VAIHTELUUN ERI VUOSIKYMMENINÄ 

Possessiivisuffiksien sisäinen jakauma eri persooniin osoittaa, että sa- 
nomalehtikieli on samantapaista vuosikymmenestä riippumatta: neut- 
raalissa ja asiakeskeisessä tekstissä 3. persoonan suffiksi on täysin val- 
litseva (ks. taulukko 32). Nykykielen lehtinäytteistä Savon Sanomissa 
1. persoonaa käytetään selvästi vähemmän kuin Helsingin Sanomissa. 
Tämä voi heijastaa savon murteen oletuksen mukaan vähäisempää suf- 
fiksin käyttöä (vrt. Latvala 1899) tai sitten lehden rennompaa tyyliä. Sen 
sijaan kirjoitelma-aineisto ja LA:n koko otos eroavat selvästi lehtikieles- 
tä, koska 3. persoonan muotoja on 15—20 prosenttiyksikköä vähemmän 
kuin lehtikielessä. Ero on 1. persoonan hyväksi. Kun LA:n aineistosta 
erotetaan ei-fiktiivinen tietokirjallisuus, jossa on mm. muistelmia, lehti- 
kielen aineistojen ero häviää. Muistelmateksteissä on ymmärrettävästi 
paljon elämäni, kotimme jne. ilmauksia. Oppikirjoissa ja fiktiossa tilanne 
on lehtikielen kaltainen mutta oppikirjoissa 2. persoonan jakauma eroaa 
runsaiden tehtävänantojen takia (vihkosi jne.). 

Suffiksien jakauma näyttää 1970-luvun sanomalehtityyppisessä kir- 
joitetussa kielessä samantapaiselta kuin 2000-luvun sanomalehtimassa- 
korpuksissa, eikä ole havaittavissa siirtymää 3. persoonan suffikseihin, 
mikä voisi viitata esimerkiksi suffiksin jonkin asteiseen kiteytymisten- 
denssiin. Sen sijaan aineisto osoittaa, että 1. ja 3. persoonan suffiksien 
välillä on tekstilajieroa (vrt. taulukot 32 ja 33). Tulkintaa vahvistaa myös 
se, että LA:n pääkirjoituksissa on puolet vähemmän 1. persoonan suffik- 
seja kuin uutis- ja reportaasiteksteissä. Toisin sanoen hyvin muodolli- 


270 MIKKO LAASANEN JA ANNELI PAJUNEN 


https://doi.org/10.21435/skst.1472 


nen ja abstrakti tekstilaji vieroo 1. persoonan suffikseja. Tulos on odotet- 
tava, koska pääkirjoituksia ei muutenkaan kirjoiteta minä-näkökulmasta 
(vaikka näkökulma sinänsä voi olla subjektiivinen). Kun sitten lehtikieltä 
verrataan muuhun aineistoon (kirjoitelmat, oppikirjat ja fiktio), sama 
korostuu. Etenkin kirjoitelmissa omakohtaisuus (minun mielestäni) ja 
muut valinnat (kotimaamme luonto) nostavat 1. persoonan käyttöä ja las- 
kevat kolmannen. 


Taulukko 32. Possessiivisuffiksien jakauma otoksissa persoonan mukaan. 


Korpus / I. p. ps 2. p. ps 3. p. ps 
Possessiivisuffiksi % kirjani, kirjamme kirjasi, kirjanne kirjansa 
LA 1970 37,1 11 61,7 
LA lehdet 1970 16,4 1,7 81,9 
Helsingin Sanomat 15,9 1,4 82,7 
Savon Sanomat 12,6 1,4 86 
Kirjoitelmat 1940-2000 30 2,6 67,3 
Oppikirjat ja fiktio 16,8 14,6 68,5 
Keskiarvo % 21,5 3,8 74,6 


Taulukko 33. Possessiivisuffiksien jakauma otoksissa persoonan ja luvun mukaan. 


Korpus / Sg. 1. p Sg.2.p Pl. 1. p PI. 2. p 3.p 
Possessiivisuffiksi % kirjani kirjasi kirjamme — kirjanne kirjansa 
LA 1970 19,6 0,1 17,5 1 61,7 
LA lehdet 1970 2,5 0,3 13,8 1,4 81,9 
Helsingin Sanomat 10,7 11 5,2 0,3 82,7 
Savon Sanomat 7,2 LI 5,4 0,3 86 
Kirjoitelmat 1940-2000 16,2 2i 13,8 0,5 67,3 
Oppikirjat ja fiktio 14,2 12,8 2,6 1,8 68,5 
Keskiarvo % 11,7 2,9 9,7 0,9 74,6 


Aineistot eivät ole täysin verrannollisia mutta osoittavat sen, että posses- 
siivisuffiksien käyttöä ja käytön muutoksia ei voi analysoida pelkästään 
yhdestä näytteestä, vaikka ajalliset erotkin olisivat näkyvissä, koska käyttö 
vaihtelee tekstilajeittain ja oletettavasti myös tekstityypeittäin. Aineisto 
osoittaa suffiksien käytön vaihtelevan myös tyylillisesti. Vanhimmissa 
teksteissä vilisee ilmaisuja kuten kotimaamme ja taloutemme, jotka 
2000-luvulla ovat vähemmän käytettyjä (ks. taulukko 33). Aineisto nostaa 
esiin myös tendenssin teitittelystä sinutteluun: monikon 2. persoonan 
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muodot menettävät asemaansa yksikön 2. persoonan muodoille. Mää- 
rällisesti ero on pieni, mutta niin on 2. persoonan yleisyyskin vähäinen. 
Sanaluokka tai sana, joka taipuu maksimaalisesti niissä taivutuskate- 
gorioissa, jotka sille ovat ominaisia, on yleensä paitsi prototyyppinen 
myös produktiivinen (ks. Pajunen 2010). Esimerkiksi substantiivi voi 
suomessa taipua sijan, luvun, possessiivisuffiksin sekä sävy- ja kysymys- 
liitepartikkelin mukaan, esimerkiksi kirjoissasikohan. Nominisanaluokat 
voi suomessa erottaa paitsi taipumisen määrän mukaan myös taivutus- 
kategorioiden mukaan. Esimerkiksi adjektiivit taipuvat ennemmin kieli- 
opillisissa kuin lokaalisissa sijoissa ja adjektiivit tai pronominit eivät 
yleensä salli possessiivitaivutusta. Kun possessiivitaivutuksen eri persoo- 
nien muodot nyt arvioidaan sen mukaan, monessako eri sanojen taivu- 
tustyypeissä ne keskimäärin esiintyvät, pystytään arvioimaan, onko tie- 
tyn suffiksin käyttö ennemmin produktiivista (mikä tahansa vaihtoehto, 
esimerkiksi sija tai luku) kuin kiteytynyttä (vaihtoehdot kasautuvat har- 
vempiin). Helsingin Sanomien aineistosta löytyy esimerkiksi lekseemistä 
aivot kaikkiaan yhteensä 17 eri suffiksin taivutusmuotoa (SgiP: aivoni, 
aivoissani, aivojeni; PlrP: aivoissamme, aivojamme, aivojemme, aivomme; 
Sg2P: aivosi, aivoissasi, aivoistasi; PlaP: —; 3P: aivoihinsa, aivojensa, aivon- 
sa, aivoillaan, aivoissaan, aivoistaan, aivojaan), mikä osoittaa, että sanaa 
käytetään monenlaisissa konteksteissa. Taivutusmuotoanalyysi on tehty 
HS2000-korpukselle (ks. taulukko 34) ja kirjoitelma-aineistolle. 


Taulukko 34. Possessiivisuffiksilliset taivutusmuototyypit ja -esiintymät HS2000-korpuk- 
sessa. 


Taivutusmuototyypit Tyyppejä Esiintymia Suhdeluku 
Ensimmäinen 10382 32207 3,1 
sg 5 720 21742 3,8 
pl 4662 10 465 2,2 
Toinen 1467 2791 1,9 
sg 1000 2159 2,2 
pl 467 632 1,4 
Kolmas 35130 167 902 4,8 
an 14767 63137 43 
an 4740 27151 5-7 
nsa 11 739 54807 4:7 
nsä 3884 22807 5,9 
Yhteensä 46 979 202 900 
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Koko HS2000-aineistossa on suffiksillisia eri sanojen tyyppejä pe- 
rusmuodossa tai jossain taivutetussa muodossa 46 979 kpl; suurin 
osa on kolmannen persoonan taivutusmuotoja (ks. taulukko 34). Kun 
näiden esiintymien kokonaismäärä (202 900) jaetaan taivutusmuoto- 
tyyppien määrällä, saadaan tulokseksi, että keskimäärin possessiivisuf- 
fiksillisella sanalla on 4,3 esiintymää. Kun sama suhdeluku lasketaan 
possessiivisuffiksin alatyypeistä, nähdään, että kolmannen persoonan 
suffiksit keskittyvät enemmän tiettyihin samoihin muotoihin — eli suhde- 
luku on korkeampi — kuin toisen ja ensimmäisen persoonan suffiksit. 
Suurin vaihtelevuus on monikollisissa suffikseissa ja suurin vaihtele- 
mattomuus kolmannen persoonan nsA-tunnuksella merkityissä esiin- 
tymissä ja ääkkösmuodoissa (-än ja -nsä). Tämä luonnollisesti viittaa 
3. persoonan muotojen kiteytymistendenssiin (funktio ei olisi enää läpi- 
näkyvästi muodosta pääteltävissä). 

Laskelmaa ei kannata tehdä aineiston kaikista osioista, koska ne ovat 
niin paljon pienempiä, että etenkin 1. ja 2. persoonan muotoja ei ole 
laskelmiin riittävästi. Persoonien välinen suhde on kuitenkin saman- 
lainen sekä lehtikielessä että esimerkiksi kirjoitelmissa. Kirjoitelmissa 
3. persoonan suhdeluku nousee ajan myötä mutta ei täysin lineaarisesti. 
Taivutusmuototyyppien ja esiintymien suhdeluku on eräänlainen diver- 
siteettilaskelma, toisin sanottuna saatuihin arvioihin vaikuttaa voimak- 
kaasti tekstimassan määrä (ks. esimerkiksi McCarthy & Jarvis 2007). 
Siksi ei ole itsestään selvä, että 3. persoonan tunnusten kiteytymisten- 
denssi toimisi yleisemmin myös muutosennusteena, mutta se osoittaa 
silti, että tietyillä tunnuksilla merkittyjen sanojen toistuvuus on kor- 
keampi kuin toisilla tunnuksilla merkittyjen. 

Kehityksellisessä aineistossa eli Koulu- ja Unelmakorpuksessa pos- 
sessiivisuffiksien käyttö keskittyy yksikön 1. persoonaan, mikä on kirjoi- 
telmien teeman (”Unelmieni päivä”) perusteella odotuksenmukaista. 
Silti kaikkien persoonien muodot ovat käytössä, nuorimmilla on jopa 
monikon 2. persoonan suffiksit hallinnassaan. Kehityksellisesti posses- 
siivisuffiksien määrä lisääntyy. Alakoulun luokkien 1.-5. kirjoitelmissa 
suffiksi on 2,6 prosentissa sanaesiintymistä, kuudesluokkalaisilla ja ylä- 
koululaisilla noin 4 prosentissa mutta nuorilla aikuisilla jo 5,8 prosenttia 
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sanaesiintymistä on suffiksillisia.°° Vuoden 2006 kuudesluokkalaisilla 
suffikseja on hieman vähemmän kuin vuoden 2014 kuudesluokkalaisil- 
la; tämä ero selittynee alueellisilla eroilla. Varhemmassa aineistossa kir- 
joittajat tulevat pohjalais- ja hämäläismurteiden alueelta, myöhemmässä 
puolet kirjoittajista on lounaismurteiden alueelta, ja erityisesti heidän 
teksteissään on paljon suffiksillisia muotoja. Aineisto kuitenkin osoittaa, 
että 2010-luvunkin lapset ja nuoret käyttävät ja osaavat käyttää posses- 
siivitaivutusta. 


POSSESSIIVISUFFIKSIT JA SANALUOKKAJAKAUMAT 
Possessiivisuffiksin kanssa esiintyvät sanat ovat aineistossa substantiiveja, 
verbejä, adverbeja ja lisäksi on muutamia luokkaan muu kerättyjä harvi- 
naisempia tapauksia. Alustava sanaluokitus on FDG-jäsentimen tekemä 
ja se perustuu kontekstuaaliseen luokitukseen (ks. Voutilainen 2002). 
Luokituksessa esimerkiksi muoto haastateltavia on tulkittu substan- 
tiiviksi eikä adjektiiviksi tai verbiksi, koska sana kontekstissaan toimii 
subjektin tai objektin funktiossa. Tähän luokitukseen on tehty joitain 
korjauksia aineistoa analysoitaessa. Esimerkiksi kiteytyneet substantii- 
vien tai adjektiivien muodot on tulkittu adverbeiksi, kuten jo mainittiin 
edellä. Siten HS2000-korpuksessa melko yleinen olotilaa ilmaiseva tyyp- 
pi -immillAAn on sanaluokaltaan adverbi (hauskimmillaan, aktiivisim- 
millaan, äärimmillään) eikä adjektiivi, vastaavasti tyyppi ahneuksissaan 
on adverbi eikä substantiivi. Erottelukriteerinä on useimmiten, että sana 
ei taivu kyseisen olotilanilmauksen merkityksessä maksimaalisesti eli 
kaikissa nominitaivutuksen muodoissa. Mieli-sanan monet sijamuodot 
ovat useimmiten adverbeja (mielestään, mielelläni). Spatiaalista tai topo- 
logista merkitystä ilmaisevat sarjat alleni, altani jne. on niin ikään tulkit- 
tu adverbeiksi. 

Pronominiksi on luokiteltu lähinnä indefiniittisiä kaikkinensa, toi- 
siaan ja itseensä -tyyppisiä muotoja mutta satunnaiset minäni, minänsä 
tyypit on tulkittu substantiiveiksi, koska niitä on käytetty minuus-tyyppis- 
ten lekseemien sijaan tai tapaan. Lukusanat aineistossa esiintyvät pää- 
asiassa nominikannan yhteydessä (45-sarjassa) ja lähinnä itsenäisinä 


69 Poiminnat Unelmakirjoitelmista on tehty sanaesiintymän muodon perusteella ja tarkistettu manuaalisesti. 
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lukusanoina esiintyvät ovat ordinaalilukusanoja (neljäntenään). Prono- 
minit ja lukusanat ovat suffiksillisina marginaalisia ja vastaavasti adjek- 
tiiveista possessiivisuffiksin kanssa esiintyy vain osa (esimerkiksi enti- 
sensä, kaltaisensa). 

Substantiivien ja verbien rajanveto on koskenut lähinnä partisiippeja. 
Kaksi kolmannesta aineiston sanamuodoista ja niiden esiintymistä on 
substantiiveja, runsaat kymmenen prosenttia adverbeja ja kymmenisen 
prosenttia verbejä (ks. taulukko 35). Ryhmään Muu kuuluvat pronominit, 
adjektiivit ja lukusanat. Verbimuodot ovat erilaisten rakenteiden, kuten 
lauseenvastikkeiden predikaattiosana. Niihin lukeutuvat seuraavat muo- 
dot: tehdäkseni, kulkiessani sekä partisiipit luvun ja sijamuodon mukaan 
eriteltynä ja lisäksi erilaiset ma-partisiipit. Substantiivin luokitus on an- 
nettu sanalle, jota ei ole ollut mitään syytä luokitella muihin sanaluokkiin. 

Sanaesiintymät, joissa on possessiivisuffiksi, jakautuvat aineiston eri 
korpuksissa sanaluokkiin samantapaisesti (ks. taulukko 35). Substantii- 
veissa on ajallisessa vertailussa 1950-, 1970- ja 1990-lukujen kirjoitel- 
missa pientä laskua mutta 2000-luvun aineistoissa lähinnä vaihtelua. 
Adverbeissa on pientä nousevaa trendiä. Possessiivisuffiksilliset verbit 
liittyvät kompleksiseen kielenkäyttöön ja aineiston perusteella näiden 
määrässä ei ole (ajallista) muutosta vaan vaihtelua. Oppikirja-aineisto 
välttelee kompleksisia verbi-ilmauksia. Muissa suffiksimuodoissa näkyy 
erityisesti kirjoitelma-aineiston omakohtainen kirjoitustyyli, joka nostaa 
mm. itse ja oma -sanojen frekvenssejä (ks. luokka Muu). Vertailun pe- 
rusteella voi todeta, että vaikka possessiivisuffiksien käytössä voi nähdä 
muutosta, kyse on ennemmin variaatiosta. 


Taulukko 35. Possessiivisuffiksisen sanan esiintymien sanaluokkajakauma korpusaineis- 
toissa. 


Aineisto / Sanaluokka % Adverbi Substantiivi Verbi Muu 
1950-luku 11,2 72 11,4 533 
1970-luku 11,3 JLI 10,0 7,6 
1990-luku 11,5 67,9 11,6 8,9 
Oppikirjat 13,9 79,5 9 6,4 
Fiktio 15,5 66,6 12,3 5,6 
Savon Sanomat 16,8 66,2 11,6 5,3 
Helsingin Sanomat 17 66,6 11,5 4,8 
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Lauseopin arkiston 1970-luvun yleiskielen teksteissä possessiivisuffiksit 
ovat olleet verbimuodoissa yleisempiä (16,3 % esiintymistä) kuin nyky- 
lehtikielessä, adverbeissa määrät ovat nykyisentapaisia (13,0 %) mutta 
substantiiveissa vähäisempiä (64,1 %). Ainoa puhutun kielen korpus, 
josta vastaavia laskelmia voi tehdä, on Lauseopin arkiston murrealueit- 
tain koottu korpus, jonka koehenkilöt ovat keskimäärin 1880-luvulla 
syntyneitä ja useimmiten 1960-luvulla haastateltuja. He siis edustavat 
aineiston vanhinta kerrostumaa, joskin aineisto on puhuttua kieltä. Suf- 
fiksiesiintymät eivät jakaudu sanaluokkiin murrealueittain samalla ta- 
voin: substantiiveja taivutetaan suffiksillisina eniten hämäläismurteissa 
(67,6 % esiintymistä) ja vähiten savolaismurteissa (48,2 %) aiemmin 
esitettyjen oletuksien mukaan. Sen sijaan possessiivisuffiksillisia ad- 
verbeja ja ei-finiittisiä muotoja on huomattavasti enemmän savolais- 
murteissa (31,6 % ja 11,8 %) kuin hämäläismurteissa (16,1 % ja 4,9 %). 
Kokonaissanamäärään suhteutettuna (40 000 murrealueittain) posses- 
siivisuffikseja on eniten juuri hämäläismurteissa (1,05 % sanaesiinty- 
mistä) mutta vähiten pohjalais- (0,55 %) ei savolaismurteissa (0,68 %). 

Kuvaa saa tarkennettua analysoimalla kirjoitetun aineistoa sana- 
luokittain ja suffiksittain suhteessa kokonaissanamääriin (ks. taulukot 
36—37).7* Substantiiveissa monikon 1. persoonan käyttö vähenee nuorilla 
aikuisilla selvästi (eli meidän maamme -tyyppinen käyttö vähenee), ja toi- 
sen persoonan suffiksi on ylipäätään harvinainen missä tahansa korpuk- 
sessa (ks. taulukko 36). Oppikirjateksteissä yksikön 2. persoonan käyttö 
on paljon yleisempää kuin muissa osa-aineistoissa ja selittyy runsaalla 
oppilaan puhuttelulla muun muassa tehtävänannoissa (kirjoita vastaus 
vihkoosi). Oppikirja-aineisto poikkeaa muusta aineistosta myös sekä 
substantiiveihin että verbeihin liitettävän 3. persoonan suffiksin osalta ja 
tämäkin selittynee tekstilajieroista käsin. Kirjoitelmien substantiiveissa 
kolmannen persoonan suffiksi on yleinen vaikka laskeekin hieman ajan 
myötä, mutta kaikkein yleisin se on 2000-luvun fiktiossa. Tämä on al- 
kuoletuksen vastaista, koska fiktio yleensä on lähempänä puhuttua kiel- 


70 Taulukoiden 36—37 laskelmia ei ole tehty HS2000-korpuksesta, koska sen kokonaissana- 
määriä ei voi laskea samalla tarkkuudella kuin muiden korpusten, eli korpusta vastaavasta 
tekstiaineistosta. 
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tä kuin sanomalehtikieli. Sanomalehtikielessä substantiivien 3. persoo- 
nan possessiivisuffiksin käyttö näyttää kirjoitelmiin verrattuna selvästi 
vähäisemmältä. Muiden persoonien osalta tilanne on vaihtelevampi ja 
taustalla on taas kerran sekä tekstilaji- että tyylieroja. 


Taulukko 36. Substantiivien possessiivisuffiksisten esiintymien määrä kokonaissana- 
määrästä. 


Aineisto / -mme -nne -ni -si -nsV/-Vn 
Possessiivisuffiksi % kirjamme — kirjanne kirjani kirjasi kirjansa 
1950-luku 0,48 0,01 0,39 0,06 1,23 
1970-luku 0,37 0,01 0,12 0,05 1,20 
1990-luku 0,19 0,02 0,54 0,04 LI7 
Oppikirjat 0,03 0,02 0,15 0,32 0,46 
Fiktio 0,08 0,05 0,32 0,08 1,68 
Lehtikieli 0,09 0,00 0,09 0,02 1,04 


Verbien ei-finiittisissä muodoissa possessiivisuffiksit ovat selvästi harvi- 
naisempia kuin substantiiveissa (ks. taulukko 37), vaikka yleisjakauma 
näyttää samantapaiselta. Erityisesti voi kiinnittää huomiota fiktioon: 
sekä substantiivi- että verbiesiintymissä 3. persoonan suffiksi on yleisin 
juuri 2000-luvun fiktiossa. Monikon 1. persoonan käyttö vähenee ajalli- 
sesti ja yksikön 1. persoonassa on vaihtelua. Oppikirjojen tehtävänannot 
nostavat myös tiettyjä verbimuotoja (luettuasi). Kolmannen persoonan 
verbimuodoissa suffiksin käyttö vaihtelee. 


Taulukko 37. Verbien possessiivisuffiksisten esiintymien määrä kokonaissanamäärästä. 


Aineisto / -mme -nne -ni -si -ns VJ-Vn 
Possessiivisuffiksi % — luettuamme luettuanne luettuani luettuasi luettuaan 
1950-luku 0,05 0,00 0,07 0,00 0,26 
1970-luku 0,02 0,00 0,02 0,01 0,22 
1990-luku 0,03 0,00 0,09 0,00 0,24 
Oppikirjat 0,00 0,00 0,01 0,04 0,09 
Fiktio 0,00 0,00 0,06 0,01 0,35 
Lehtikieli 0,01 0,00 0,02 0,00 0,19 


Adverbeissa käytössä on lähinnä yksikön 1. ja 3. persoonan muotoja (ks. 
taulukko 38). Aineistokohtaiset erot näyttävät hyvin samanlaisilta kuin 
substantiivien ja verbienkin kohdalla. Ainoa poikkeus on sanomalehti- 
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aineisto (Savon Sanomat), jossa 3. persoonan possessiivisuffiksillisia ad- 
verbeja on käytössä suhteessa enemmän kuin substantiivien ja verbien 
kohdalla. Johtuuko tämä sitten vanhasta murre-edustuksesta, tekstin 
luonteesta vai mistä, jää selvittämättä. 1970-luvun kirjoitelmien tilanne 
ei kuitenkaan paljoa poikkea sanomalehtikielestä. 


Taulukko 38. Adverbien possessiivisuffiksisten esiintymien määrä kokonaissanamäärästä. 


Aineisto / -mme -nne -ni -si -nsV/-Vn 
Possessiivisuffiksi % — mukaamme mukaanne mukaani mukaasi mukaansa 
1950-luku 0,02 0,00 0,08 0,01 0,32 
1970-luku 0,01 0,00 0,02 0,00 0,29 
1990-luku 0,02 0,00 0,09 0,01 0,32 
Oppikirjat 0,00 0,00 0,04 0,04 0,18 
Fiktio 0,01 0,01 0,09 0,01 0,40 
Lehtikieli 0,00 0,00 0,02 0,00 0,31 


Possessiivisuffiksien käytön mahdollinen muutos voi tulla esiin myös 
sanaluokkien sisäisenä. Substantiivien osalta pitäisi tehdä laadullista 
analyysiä, ja se ei ole aineiston koon vuoksi mahdollista. Verbiluokkaa 
voi sen sijaan analysoida sekä verbimuotojen että niiden funktioiden 
perusteella melko helposti (ks. taulukot 39 ja 40). Tarkastellut raken- 
teet ovat agenttirakenne (tekemästäni työstä), jotta-rakenne (saadakseni 
aikaan), samanaikaista (= SA) tai eriaikaista (= EA) referointia ilmaiseva 
rakenne (tiesin kuulevani tai kuulleeni) ja vastaavasti temporaalirakenne 
(nähdessäni tai nähtyäni). Mukana ovat luonnollisesti vain ne rakentei- 
den muodot, joissa possessiivisuffiksi on mahdollinen eli samasubjek- 
tilliset muodot; samasubjektiivisuus oikeastaan tarkoittaa refleksiivistä 
käyttöä. Varhemmin yleiskielessä ja kansanrunoudessa on esiintynyt 
myös erisubjektisia suffiksillisia muotoja (sano sanoneeni, luulin tunte- 
vanne asian), mutta näistä ei aineistossa ole jälkeäkään (ks. esimerkik- 
si Hakulinen 1979, 566). Tarkastelussa on lisäksi tekevinään-rakenne, 
ja kategoriaan Muu on luettu muutama muukin harvinaisempi tyyppi 
(kuten tekemäisillään). Käsittelemme erikseen taivutusmuotojen esiinty- 
mien sisäistä jakaumaa (ks. taulukko 39) ja osuutta kokonaissanamää- 
ristä (ks. taulukko 40). 
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Taulukko 39. Possessiivisuffiksillisten verbiesiintymien aineistokohtaiset jakaumat funk- 
tion mukaan. 


Aineisto / kuulemani kuullakseni kuulevani kuulleeni kuullessani kuultuani Muu 
Verbimuoto % SA EA SA EA 
1950-luku 11,7 18,3 14,3 4,1 37,0 10,3 43 
1970-luku 16,3 18,8 15,5 3,4 30,7 12,0 3,2 
1990-luku 14,7 16,9 18,6 4,1 33,9 9,9 1,9 
Oppikirjat 31,6 111 12,0 2,8 31,6 7,6 3,4 
Fiktio 10,5 15,8 22,07 8,9 26,3 12,91 3,5 
Lehtikieli (SS) 15,1 11,4 23,8 11,8 23,4 12,4 2,1 


Verbiesiintymien jakauma kirjoitelmissa ja fiktiossa (ks. taulukko 39) 
poikkeaa jonkin verran lehtikielesta. Selvin ero on referentiaalista ja 
temporaalista samanaikaista tekemistä ilmaisevissa rakenteissa: lehti- 
kielessä referentiaalinen on yleisin, muissa tekstilajeissa temporaalinen. 
Ero on luonnollinen, koska lehtitekstissä on keskeistä tarve referoida 
haastateltuja, mutta kertovissa tekstilajeissa suhteutetaan tapahtumia 
myös ajallisesti. Jotta-rakenne on vähäkäyttöisin oppikirjoissa ja lehtikie- 
lessä. Agenttipartisiippeja käytetään erityisesti oppikirjateksteissä. Kir- 
joitelma-aineistosta ei tule esiin selvää ajallista muutosta. Referentiaa- 
linen samanaikaista tekemistä ilmaiseva rakenne lisääntyy ajan myötä, 
vastaava temporaalinen on lievästi laskusuuntainen, jotta-rakenne niin 
ikään vähenee mutta agenttipartisiipit lisääntyvät. Kun suffiksillisten 
verbiesiintymien määrä suhteutetaan otoksen sanamäärän (ks. taulukko 
40), tilanne on edelleen varioiva. 1950-luvun aineistossa esiintymiä 
on enemmän kuin 1970-luvun aineistossa mutta 1990-luvun aineisto 
muistuttaa taas 1950-luvun osuuksia. Vähiten suffiksillisia verbiesiin- 
tymiä on suhteessa sanamäärään lehtikielessä ja etenkin oppikirjoissa. 


Taulukko 40. Possessiivisuffiksillisten verbiesiintymien määrä kokonaissanamäärästä. 


Aineisto / kuulemani kuullakseni kuulevani kuulleeni kuullessani kuultuani 
Ps-verbimuoto % 

1950-luku 0,05 0,08 0,06 0,02 0,16 0,04 
1970-luku 0,05 0,05 0,05 0,01 0,09 0,03 
1990-luku 0,06 0,07 0,08 0,02 0,15 0,04 
Oppikirjat 0,05 0,02 0,02 0,00 0,05 0,01 
Fiktio 0,04 0,06 0,09 0,04 0,11 0,05 
Lehtikieli (SS) 0,03 0,02 0,05 0,03 0,05 0,03 
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Yleistyksenä voi todeta, että mitä henkilökohtaisempi näkökulma kir- 
joittajalla on tapahtumiin, sitä korkeammalle nousevat samasubjektiset 
rakenteet. Ero heijastuu suoraan oppikirjateksteihin, joissa lauseen- 
vastikkeita on paitsi vähemmän, myös niiden jakauma poikkeaa muista 
aineistoista. Tapahtumien saman- tai eriaikaisuus ei sen sijaan niinkään 
liity näkökulman henkilökohtaisuuteen. 


EROAVA JA EROAMATON OMISTUS 

Possessiivisuffiksien käytön mahdollista muutosta voi tarkastella myös 
sellaisten sanojen avulla, joiden yhteydessä omistaminen on luonnollista 
(inalienable; eroamaton omistussuhde) tai perustuu juridiseen oikeuteen 
(alienable; eroava omistussuhde). Toinen mahdollisuus olisi ottaa tarkas- 
teluun adverbeja ja olotilanilmauksia, joissa possessiivisuffiksit ovat ki- 
teytymässä vaihtelemattomaan muotoon ainakin joissain puhutun kie- 
len varianteissa (tein tahallani > tahallaan; olin raivoissani > raivoissaan). 
Keskitymme tässä edelliseen ryhmään, koska omistussuhdetta ilmaise- 
via sanoja on koko aineistossa edustavammin kuin kyseisiä adverbeja. 
Lisäksi monissa lähteissä todetaan, että adverbeissa kongruoimattomia 
tapauksia on ollut vanhastaan.” 

Vertaamme eroamatonta omistusta ilmaisevia, ruumiinosia tai suku- 
laisuhteita nimeäviä sanoja (käsi, veli) sanoihin, joiden yhteydessä il- 
maistava omistussuhde on eroava (kuten kirja, talo), joko juridinen 
omistussuhde tai hallintasuhde (Heine 1997). Nimitämme näitä sanoja 
indeksisanoiksi, ja niiden avulla voi esittää hypoteesin, että eroamatto- 
man (luonnollisen) omistuksen yhteydessä possessiivisuffiksi on odo- 
tuksenmukaisempi ja yleisempi kuin eroavan (juridisen). Lisäksi jälkim- 
mäisistä on useammin syytä kirjoittaa myös muusta kuin omistamisen 
tai yhteenkuuluvuuden näkökulmasta. Kontekstissa voi tietysti aina olla 
kysymys omistussuhteen ilmaisemisesta, jota merkitään tai ollaan mer- 
kitsemättä possessiivisuffiksilla, tai sitten muusta käytöstä. Esimerkiksi 
sanalla äiti voidaan viitata omaan äitiin (äitini) tai voidaan puhua yleensä 
äideistä (äidit ja lapset). 


71 Mark (1925, 242) antaa esimerkkejä vanhasta kirjasuomesta, murteista ja yleiskielestä (esimerkiksi 
Satakunta: olin vain muuten vaitonaan; Agr. mine se yxinens olen. 
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Olemme valinneet indeksisanoiksi etenkin sellaisia sanoja, joita ai- 
neiston eri osissa on tilastollisesti riittävästi. Indeksisanat on jaettu 
omistussuhteen luonteen mukaan neljään ryhmään eli ruumiinosia ni- 
meäviin sanoihin (aivot, jalka, kasvot, käsi, nenä, tukka), sukulaissanoihin 
(isä, poika, sisar, tytär, veli, äiti), elottomia olioita nimeäviin sanoihin 
(kirja, pöytä, ruoka, takki, talo) sekä abstrakteihin sanoihin, jotka edus- 
tavat sekä eroavaa (raha, teko, juoksu, isänmaa) että eroamatonta (aja- 
tus, omatunto) omistussuhdetta. Valituilla indeksisanoilla on koko ai- 
neistossa yhteensä 118 164 esiintymää, joista possessiivisuffiksillisia on 
13 653 kpl (eli 11,5 %). Kun lehtikielessä (HS2000- ja SS2000-korpukset) 
substantiivien suffiksiprosentti on keskimäärin 2-3 prosenttia, indeksi- 
sanojen valintaa voi pitää onnistuneena. Jaottelemme aineiston ensin 
lehtikieleen (HS ja SS) ja muihin teksteihin (kirjoitelmat, oppikirjat ja 
fiktio) ja käsittelemme sitten kirjoitelma-aineistoa myös ajallisesta nä- 
kökulmasta. Kirjoitelma-aineisto on indeksisanojen analyysissä muka- 
na kokonaan (kaikki miljoona sanaesiintymää), jotta esiintymiä löytyisi 
riittävästi. Lopuksi kommentoimme lyhyesti kehityksellistä aineistoa. 

Yleisero omistussuhteen laadun mukaan on kummassakin ryhmässä 
oletuksen mukainen (taulukko 41): possessiivisuffiksi merkitään eroa- 
mattoman omistussuhteen yhteydessä merkitsevästi useammin kuin 
eroavan. 2000-luvun lehtikielessä ei ole eri aineistojen välillä suurta 
eroa. Sekä Savon Sanomissa että Helsingin Sanomissa suffiksi on suunnil- 
leen yhtä yleinen toisaalta eroamattoman omistussuhteen (18—21 %) 
kuin toisaalta eroavan omistussuhteen ilmaisuissa (5-7 % esiintymistä). 
Helsingin Sanomien hienoinen yleisemmyys johtunee toimituksen tie- 
toisesta oikeakielisyyden vaalinnasta.? Fiktiossa, oppikirjateksteissä ja 
kirjoitelmissa (luokka Muut) tilanne poikkeaa lehtikielestä merkitseväs- 
ti: sekä ruumiinosasanoissa (ero yli 15 prosenttiyksikköä) että abstrakti- 
sanoissa (ero yli 10 prosenttiyksikköä) possessiivisuffikseja on merkitse- 
västi enemmän. Froamattoman omistuksen osalta erot ovat pienet. 


72 Huomautus perustuu 2000-luvun alussa HS:n toimituspäällikön antamaan tietoon, jonka mukaan 
toimituksen aamupalavereissa käsiteltiin päivittäin myös oikeakielisyyttä. 
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Taulukko 41. Indeksisanojen possessiivimuotojen määrä esiintymäluokittain. 


Aineisto / Ps-indeksisanat 6 | Ruumiinosa Sukulaisuus Eloton Abstrakti 
käteni isäni kirjani mieleni 
Savon Sanomat 18,2 18,8 5,7 6,8 
Helsingin Sanomat 21,6 19,8 6,3 7,0 
Muut 35,6 21,4 25 179 


60 
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aivot 
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kasvot 
käsi 
nenä 
tukka 
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äiti 
veli 
sisar 
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Kaavio 11. Indeksisanan possessiivimuotojen osuus sanan esiintymistä korpuksit- 
tain. 


Jos käyttöä katsotaan indeksisanoittain (kaavio 11), nähdään, että erot ei- 
vät synny aivan tasaisesti, vaan joidenkin sanojen käyttökonteksti suosii 
possessiivisuffiksia yli omistussuhteen luonteen tai semanttisen luokan 
vaikutuksen. Esimerkiksi sanasta takki omistussuhde ilmaistaan useam- 
min kuin muista elottoman luokan indeksisanoista. Sanoista veli, sisar 
ja tytär omistussuhde ilmaistaan useammin kuin sanoista isä ja äiti, 
poika-sanasta puhumattakaan. Kuten jo edellä nähtiin, muissa teksteissä 
omistussuhteen ilmaiseminen on yleisempää kuin lehtitekstissä mutta 
indeksisanoittainen tarkastelu kuitenkin osoittaa, että tämä ei päde kai- 
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kista yksittäisistä sanoista. Erot ovat hyvin pienet sanoissa kirja, ruoka, 
juoksu, raha ja poika, sanoissa ruoka ja raha omistussuhde ilmaistaan 
kaikissa osakorpuksissa harvoin. Abstraktisanoissa lehtikielen ja mui- 
den tekstien suurimmat erot syntyvät sanoista ajatus, omatunto, teko ja 
isänmaa, mistä voi päätellä, että muissa teksteissä tyylilaji on lehtikieltä 
henkilökohtaisempi ja yksilöivämpi. Kaikissa ruumiinosasanoissa omis- 
tussuhde ilmaistaan muissa teksteissä yleisesti, ja ero lehtikieleen on 
hyvin selvä. Sukulaissanoista veli esiintyy muissa teksteissä useammin 
suffiksillisena kuin ilman, sanan sisar kokonaisfrekvenssi on oikeastaan 
liian matala johtopäätöksiin. 

Mahdollista ajallista muutosta tarkastelemme luokasta Muu, jota 
edellä käsiteltiin kokonaisuutena. Nyt erottelemme ne aiempaan tapaan 
nuorten aikuisten kirjoitelmiin sekä oppikirjateksteihin ja fiktioon. Kir- 
joitelmat on jaettu kolmia siten, että vanhimmassa osiossa on vuosien 
1940-1960 kirjoitelmia, toisessa vuosien 1970-1980 ja uusin aineisto 
koostuu vuosien 1990-2003 kirjoitelmista. Indeksisanojen frekvenssi 
vaihtelee näissä osiossa 2 000-3 ooo välillä. Fiktio- ja oppikirjateksteissä 
frekvenssi on 1500-2000. 


Taulukko 42. Indeksisanojen possessiivimuotojen määrä eri aineistoissa. 


Aineisto / Ps-indeksisanat % Ruumiinosa Sukulaisuus Floton Abstrakti 
käteni isäni kirjani mieleni 
Kirjoitelmat 1940-1960 38,0 24,1 8,7 21,6 
Kirjoitelmat 1970-1980 32,7 24,4 8,8 21,9 
Kirjoitelmat 1990-2003 29,9 26,1 3,8 21,1 
Oppikirjat 29,3 8,9 5,5 1,2 
Fiktio 46,3 28,4 11,5 14,7 


Kirjoitelmissa indeksisanojen suffiksimäärät eivät vaihtele odotuksen- 
mukaisesti, toisin sanoen suffiksien käyttö ei laske suoraviivaisesti 
1940-luvulta 2000-luvulle, kuten puhutun kielen ennusteet antaisivat 
odottaa (ks. taulukko 42): yleisyys pysyy vuosikymmenestä toiseen aika 
samanlaisena sukulaissanoissa ja abstraktisanoissa, sukulaissanoissa on 
hienokseltaan jopa nousua ajan myötä. Eroavan omistussuhteen yhtey- 
dessä suffiksin käyttö on vähentynyt uusimmissa kirjoitelmissa, mutta 
esiintymiä ei ole riittävästi luotettavien päätelmien tekemiseksi. Ruu- 
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miinosanimien yhteydessä käyttö on laskenut tasaisesti. Kun kirjoitel- 
mia verrataan fiktioon, käy ilmi, että suffikseja käytetään juuri fiktiossa 
eniten kaikissa muissa ryhmissä paitsi abstraktisanoissa. Myös oppi- 
kirjatekstit toistavat jo aiemmin esiin tulleita eroja: sufikseja käytetään 
vähiten oppikirjateksteissä 2. persoonaa lukuun ottamatta, oli tarkaste- 
lunäkökulma mikä tahansa. 

Jos possessiivisuffikseja arvioidaan kehityksellisestä aineistosta eli las- 
ten ja nuorten aikuisten 2000-luvun Unelmakirjoitelmista (ks. Pajunen, 
Puranen & Yli-Paavola 2010; Pajunen 2016), tilanne näyttäytyy enti- 
senlaisena sikäli, että suffiksien käyttö ei ole ennusteiden mukaisesti 
loppunut. Käyttö on edelleen runsaampaa eroamattoman kuin eroavan 
omistussuhteen yhteydessä (ks. taulukko 43) ja se lisääntyy kehitykselli- 
sesti. Unelma-aineistossa indeksisanojen esiintymiä on yhteensä 3239 
ja näistä possessiivisuffiksillisia on noin 20,2 prosenttia eli enemmän 
kuin kirjoitelmissa. Luvut ovat kuitenkin hieman harhauttavia, koska 
indeksisanoja on koko aineistossa suhteellisen vähän ajalliseen aineis- 
toon verrattuna. Suffiksilliset sanat jakautuvat Unelma-aineistossa 
taulukon 41 indeksisanoihin hieman eri tavalla ja eroavuutta on myös 
indeksisanojen luokittaisissa frekvensseissä. Abstraktisanojen esiinty- 
mämäärä ei riitä arvioitavaksi: esimerkiksi isänmaa tai omatunto eivät 
liity lainkaan 2000-luvun unelmakontekstiin. Myös ruumiinosasanojen 
frekvenssit ovat vähän liian matalat, jotta tulos olisi aikuisia lukuun ot- 
tamatta luotettava. Pääasiassa sanat käsi ja jalka taipuvat suffiksillisina. 
Sen sijaan sukulaissanastoa on paljon (esiintymiä yht. 1600) ja eniten 
niitä on nuorimmilla alakouluikäisillä. Tämä johtuu siitä, että lapsilla 
unelmat keskittyvät perhepiiriin, ja unelmia toteutetaan yhdessä isän, 
äidin ja sisarusten kanssa. Aikuisilla sukulaissanasto hajaantuu ja mai- 
nintoja on paljon vähemmän. 


Taulukko 43. Indeksisanojen possessiivimuotojen määrä kehityksellisessä aineistossa eli 
Unelmakirjoitelmissa. 


Unelma-aineisto / Ps-indeksisanat% | Ruumiinosa — Sukulaisuus Eloton 
käteni % isäni % kirjani % 
Alakoulu 1.-5. 18,8 11,4 2,7 
Alakoulu 6. 52,6 29,7 8,4 
Aikuiset 58,1 61,1 10,3 
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Unelma-aineistoa analysoitaessa täytyy ottaa huomioon, että se on tuo- 
tettu jossain määrin muodollisessa kontekstissa joko oppitunnilla tai 
jossain oppilaitoksessa. Kielenhallinnan kannalta muodollisuus ei hait- 
taa, vaan aineisto osoittaa paremmin, että nykylapset, nuoret ja nuoret 
aikuiset vielä hallitsevat possessiivisuffiksien käytön käyttöön pyrkies- 
sään.? Suffiksin tuottaminen voi olla tavoitteena silloinkin, kun sanan 
taivutus ei onnistu (ks. esimerkki 1). Suffiksimuotojen käytön runsaus 
Unelmakirjoitelmissa liittynee referentiaalisten määräisten ilmauksien 
käyttöön ja tämän käytön kehittymiseen, kuten Kouvon ja muiden ana- 
lyysistä tässä teoksessa käy ilmi. Kun nuorimmilla niin sanottu tuttu 
tieto esitellään ensimaininnan kautta (äiti), vanhemmilla se tehdään 
lisääntyvästi uudelleen maininnan kautta ja tarkenteellisena (äitini). Ai- 
neistosta näkyy kuitenkin hyvin, että suffikseja ei käytetä mekaanisesti. 
Jos esimerkiksi kirjoittajan äiti on jo esitelty lukijalle, häneen ei jatku- 
vasti viitata possessiivisuffiksilla. Sana äiti on perhepiirissä myös äidin 
nimi, mikä näkyy muun muassa taivutuksen — ja suffiksin — puuttumi- 
sesta (esimerkiksi äitin). Kirjoittaja, jonka isä tekstissä paljastuu isä- 
puoleksi, viittaa jatkossa oikeaan isäänsä aina possessiivisuffiksillisena. 
Samanlaista informaatiota välitetään lukijalle myös, kun puhutaan vaik- 
kapa yleensä ruoasta ja toisaalta omasta lempiruoasta (lempiruokani), 
omasta työpöydästä (työpöytäni) jne. Kun esineeseen on omistussuhde 
tai sen tarkoitteeseen viittaussuhde ja suhdetta halutaan korostaa, sana 
taipuu suffiksillisena. 

Kirjoittamiskonteksti ja kirjoittamistehtävä vaikuttavat possessiivi- 
suffiksien käyttöön ja käyttötapaan paljon. Myös kehityksellinen aineisto 
viittaa suffiksien käytön kontekstuaaliseen variaatioon. 


1) Mukana oli kaverini Miina ja isovelini Pete. (3F15)* 


73 Vastaava yleiskieleen pyrkiminen näkyy puhekielisen aineksen suhteellisena vähyytenä Unelma- 
aineistossa (ks. Salonen 2012). Ne nuorimmat alakouluikäiset, jotka jo saavat tuotettua kertovaa 
tekstiä, käyttävät mm. subjekti-predikaattikongruenssia runsaasti, myös monikon 1. persoonassa. 
Murrosikä muuttaa tilannetta joksikin aikaa. 

74 Tunniste luetaan seuraavasti: 3 = luokka-aste, F = tyttö, 15 = kirjoitelman tunniste korpuksessa. 
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Indeksisana voi kontekstissa liittyä omistussuhteen ilmaisuun myös 
ilman suffiksia. Oppikirjateksteissä ruumiinosia tarkastellaan useim- 
min elollisen ja inhimillisen rakenteeseen kuuluvina ja silloin kielen- 
nös on ennemmin osa-kokonaisuussuhteisena (ihmisellä on neljä raajaa, 
ihmisen aivot) kuin possessiivisuffiksillisena omistussuhteena (hänen 
aivonsa). Muissa aineiston osissa omistussuhde ilmaistaan hyvin usein 
erisnimen tms. genetiivillä (X:n käsi). Aineistossa on myös sanontoja 
(kengät jalassa, tallustella kahdella jalalla) ja idiomeja (jäädä jalkoihin), 
joita käytetään ilman suffiksia. Omistussuhteen ilmaisuun riittää useim- 
miten pelkkä possessiivisuffiksi, mutta viittaussuhteesta riippuen kysee- 
seen tulee myös persoonanpronominin ja suffiksilla merkityn pääsanan 
yhdistelmä (minun kirjani). Tämä yhdistelmä on puhutun kielen varassa 
tehtyjen muutosennusteiden perusteella erityisen mielenkiintoinen, ja 
ennuste on, että suffiksi jää pois. 

Kirjoitelma-aineistosta löytyy kaikkiaan 321 esimerkkiä persoonapro- 
nominin (minun/meidän, sinun/teidän, hänen/heidän) ja indeksisanan 
yhdistelmästä, ja näistä viidestä odotuksenmukainen suffiksi puuttuu 
puhutun kielen ennusteen mukaan (ks. 2a-e). Kolme ensimmäistä esi- 
merkkiä on tyyppiä meidän x (2a—c) eli edustaa käyttötapaa, joka tunne- 
taan jo vanhastaan suffiksittomana. Vanhimmissa aineiston osissa tosin 
on käytössä meidän x:mme -tyyppi. Esimerkiksi maa-sanan esiintymistä 
on suffiksillisia vanhimmissa kirjoitelmissa 44,6 prosenttia ja uusim- 
missa enää vain 13,6 prosenttia (vrt. taulukot 32 ja 33). Esimerkki 2d) 
vaikuttaa heikosti muodostetulta ja voi olla, että oma-sana on hankaloit- 
tanut rakenteen tuottoa. Lähinnä esimerkki 2e) edustaa puhutun kielen 
mun tukka -tyyppiä. Oireellisesti esimerkki on uusimmasta kirjoitel- 
ma-aineistosta. Yhden esiintymän todistusvoima on tosin satunnaisen 
luokkaa. 


2a) ”Kyllä meidän pojasta lääkäri tulee, kunhan vain yrittää.” 
(Kirjoitelmat 1976, 647220) 

2b) Epäonnistumisen itkulle ei meidän talossa ollut tilaa — —. 
(Kirjoitelmat 1996, 1114870) 

2c) Kyllä meidän äitikin osaa ajaa, Tony uhosi. (Fiktio) 
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2d) — — nollia kuin hänen omissakaan rahoissa. 
(Kirjoitelmat 1971, 468457) 

2e) Loppua kohden hänen ajatukset ovat muuttuneet: — —. 
(Kirjoitelmat 1993, 1040062) 


MUUTOKSIA TUNNUKSEN VALINNASSA 
Tarkastelemme lopuksi vielä muutoksia possessiivisuffiksin tunnuksen 
tyypissä oletuksena, että tunnuksen lyheneminen voi helpottaa suffiksi- 
muodon kiteytymistä. Siten muoto mielellänsä tuntuisi henkilöviittei- 
semmältä kuin muoto mielellään ja jälkimmäinen on helpompi yhdistää 
1. persoonaan (tekisin sen mielellään) kuin edellinen (tekisin sen >mielel- 
länsä). Tiedetään myös, että possessiivisuffiksien tunnusvariaatio on ol- 
lut vanhastaan hyvin suurta ja niiden kehityshistoria on pitkä. 
Uralilaiskielissä erotetaan yleensä sekä absoluuttinen että possessiivi- 
nen deklinaatio, jotka eroavat paitsi sijojen määrässä myös taivutustun- 
nuksissa. Possessiivisen taivutuksen tunnukset ovat olleet yhteydessä 
persoonataivutukseen (Itkonen 1955), lisäksi possessiivisessa taivutuk- 
sessa oletetaan vanhastaan erotetun sekä omistajan että omistetun useus 
eri tunnussarjoilla (ks. Mark 1925; Itkonen 1955). Suomessa possessii- 
visen taivutuksen yksinkertaistuminen analogian ja kontaminaation 
tietä on yhdistänyt tunnuksia ja vähentänyt annettuja merkityksiä. Esi- 
merkiksi Iitin murteen lisäksi vanhassa kirjasuomessa näkyvä posses- 
siivitaivutuksen vahva aste astevaihtelusanoissa liittyi yksikölliseen 
omistajaan ja heikko aste monikolliseen (Mark 1925, 243—244; Rapola 
1965, 103-109). Enää astevaihtelua ei ole. Eri persoonissa tunnuksen 
valinta on varioinut aiemmin paljon etenkin puhutussa kielessä. Nyky- 
kielessä variaatio on pitkälti tasoittunut mutta näkyy edelleen sekä puhu- 
tun että kirjoitetun kielen kolmannen persoonan suffiksista, jonka tun- 
nus on joko nsA tai vokaalin pidennys ja n (Vn). Markin (1925, 205) 
mukaan murteissa on ollut neljä eri 3. persoonan suffiksin tunnusta: 
a) *-nssk (eli murteissa mm. -s ~ -ns ~ -sA ~ -sAk ~ -sA ~ -se), b) *-nssn 
(mm. -sen ~ -se ~ -sAn ~ -sAAn ~ -nsAn), c) *-hsn ja d) *-hsk. Näistä b ja d 
ovat levikiltään kapea-alaisia mutta a ja c ovat esiintyneet (ja esiintyvät) 
(lähes) koko kielialueella; lähinnä (eräissä) lounaisissa murteissa käytös- 
sä on vain a-tunnus eli ns > -s (ks. Mark 1925, 206). 
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Tunnuksilla ei enää ole merkityseroa. Ne olivat komplementaarises- 
sa distribuutiossa sekä 1800-luvulla että myöhemmin siten, että nsA 
esiintyi nominatiivissa, genetiivissä, akkusatiivissa ja illatiivissa (sekä 
aiemmin myös allatiivissa) eli lähinnä n-päätteisissä muodoissa, muis- 
sa sijoissa molemmat ovat lyhyen vokaalin jälkeen mahdollisia. Tun- 
nuksien alkuperä on edelleen jossain määrin tulkinnallinen. Markin 
(1925, 31-53) mukaan Ahlquist esitti 1863, että hän-pronominiin palau- 
tuva Vn on alkuperäisempi ja nsA palautuu siihen. Budenz sen sijaan 
argumentoi 1869 ns. n-koaffiksiteorian puolesta, jonka mukaan nsA on 
monikollinen muoto (monta omistajaa) ja hAn (< *sAn) yksiköllinen 
(yksi omistaja). Sittemmin 1890-luvulla sekä Setälä että Paasonen puol- 
sivat koaffiksiteoriaa, ja se tuntuu edelleen olevan muodossa tai toisessa 
hyväksytty. Szinneyi esitti 1900-luvun alussa, että kaikissa suomalais- 
ugrilaisissa kielissä olisi kaksi suffiksisarjaa omistajan määrän mukaan 
ja juuri n-elementti merkitsisi useutta. Itkonen (1955) oletti saamelais- 
kielten perusteella, että n-aines palautuu vanhaan duaalin tunnukseen, 
toisaalta Rapola (mp.) puolsi k-tunnusta monikon merkkinä. 

Fi ole tiedossa, milloin sarjat olisivat suomessa langenneet yhteen, 
mutta niiden variaatio on edelleen olemassa joskin tasoittunut sanavar- 
talon ja sijan mukaan. Lauri Hakulinen (1979, 112) katsoo, että vanha 
kirjasuomi nojasi yksin läntiseen nsA-tunnukseen — tosin huomioimatta, 
että tunnukset olivat myös länsimurteissa rinnakkaisia — ja että 1800- 
luvun alusta rinnalle olisi noussut muista murteista omaksuttu Vn niis- 
sä sijoissa, jotka päättyivät lyhyeen vokaaliin. Tämä tunnus olisi 1800- 
luvun puolivälin jälkeen yleistynyt. Häkkisen (1994, 221-224) mukaan 
vanhassa kirjasuomessa tunnus oli *nsA(k) ja itämurteissa oli käytössä 
sen variantti sA. Vhaelin 1700-luvun kieliopissa Vn liitetään savolaiseen 
hVn-tunnukseen — joka Markin mukaan kuitenkin oli laaja-alainen — ja 
Beckerin kieliopissa vuodelta 1824 tyyppi mainitaan rinnan nsA-tun- 
nuksen kanssa, jota kuitenkin vielä pidetään ensisijaisena. Collanin 
kieliopissa 1840-luvulla Vn jo todetaan tavalliseksi sekä puhutussa että 
kirjoitetussa kielessä (ks. Häkkinen mp.). Nykynäkemysten mukaan va- 
riaatiotilanne olisi ollut jo kauan ohi ja tunnukset olisivat komplemen- 
taarisessa distribuutiossa sananlopun äännesuhteiden mukaan. 

Lehtikielessä tunnuksien esiintymien jakauma on sekä substantiiveis- 
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sa että verbeissä jonkin verran nsA-tunnuksen hyväksi (noin 55:45). Mo- 
lempia tunnuksia käytetään produktiivisesti, useiden eri lekseemien 
yhteydessä ja monissa eri funktioissa. Sekä substantiivien että verbien 
osalta tunnukset ovat osaksi komplementaarisessa distribuutiossa, 
osaksi vapaassa vaihtelussa. Substantiivien osalta nsA on pakollinen no- 
minatiivi-, genetiivi- ja illatiivisijoissa sekä partitiivisijassa aa-konteks- 
tissa, joka muodollisesti usein lankeaa yhteen vastaavan illatiivimuodon 
kanssa (hoitaa tehtävää(nsä), uppoutua tehtävää(n/sä)) ja jossa Vn ei siten 
ylipäätään ole mahdollinen. Muissa partitiiviesiintymissä tunnukset ovat 
vapaassa vaihtelussa (lentokoneitansa — lentokoneitaan). Kaikkien muiden 
sijojen osalta esimerkiksi Hakulinen, Vilkuna, Korhonen, Koivisto, Hei- 
nonen & Alho (2004, 125) katsovat, että Vn on ainoa vaihtoehto. Verbien 
osalta referentiaalisen lauseenvastikkeen ainoa mahdollinen tunnus on 
nsA, muissa verbimuodoissa variaatio on mahdollista, joskin epätoden- 
näköistä. Agenttipartisiipin sijamuodot ja niin ikään possessiivisuffiksin 
tunnukset vaihtelevat kontekstin mukaan. 

Partitiivisijassa tunnus vaihtelee odotuksenmukaisesti kaikissa osa- 
korpuksissa (ks. kaavio 12). Se on nsA 10-15 prosentin todennäköisyy- 
dellä, mutta näistä vain muutama prosentti on aitoja variaatiotapauksia. 
Esimerkiksi HS2000-korpuksessa seuraavat esimerkit ovat vapaassa 
vaihtelussa: ammattitaitoansa — ammattitaitoaan, ansioitansa, asioitansa, 
etujansa, hintojansa, kaveriansa, kohtaloansa, kotejansa, lastansa, nuortan- 
sa, peukaloansa, teitänsä, tietänsä jne. Muissa sijamuodoissa eli essiivissä 
sekä sisäisissä ja ulkoisissa paikallissijoissa illatiivia lukuun ottamatta 
vapaa vaihtelu on edelleen mahdollinen mutta partitiivia vielä margi- 
naalisempaa (translatiivi: osoitteeksensa; essiivi: kuolemanansa; inessiivi: 
luolassansa; elatiivi: urastansa, työtaidoistansa, juuristansa; adessiivi: tahol- 
lansa, pihoillansa; ablatiivi: maaltansa; allatiivi: lainoillensa, olallensa; ko- 
mitatiivi: mielipiteinensä, pannuinensa, tuotteinensa). Ajallisesti arvioiden 
ainakin nuorten kirjoitelmissa variaatio on vähentynyt: 1950-luvun teks- 
tien paikallissijoissa on muutaman prosenttiyksikön verran variaatio- 
ta, joka 1990-luvulle tultaessa on lähes hävinnyt. Yllättäen vaihtelua 
on lähes 1950-luvun tapaan alakoulun oppikirjoissa mutta ei lainkaan 
2000-luvun fiktiossa. Verbimuodoissa vapaa vaihtelu on satunnaista 
(eläessänsä; puhdistaaksensa). 
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DSR EF 
98 W partitiivi 
m translatiivi 
90 m essiivi 
minessiivi 
o, 
a m elatiivi 
85 adessiivi 
m ablatiivi 
allatiivi 
80 
m komitatiivi 
75 
HS2000 50-luku 70-luku 90-luku [N Fiktio 


Kaavio 12. 3. persoonan Vn-tunnuksen osuus vaihtelusta sijoittain. 


Nykyvaihe näyttää siltä, että tunnusten täydennysjakauma on selkiyty- 
nyt, mutta etenkin partitiivissa ja paikallissijoissa on jonkin verran 
tunnusten vapaata vaihtelua. Eniten yleiskuvasta poikkeaa 1950-luvun 
aineisto, mutta koska lähes yhtä paljon vaihtelua on 2000-luvun oppi- 
kirja-aineistossa, ei voi todeta, että vapaa vaihtelu olisi kokonaan hävin- 
nytkään. Partitiivi on ainoa sija, jonka yhteydessä on sanamuodoittai- 
nen täydennysjakauma. Sananmuotoesiintymien ja sanaesiintymien 
perusteella laskien nsA-tunnus on yleisempi kuin Vn-tunnus, vaikka 
Vn esiintyy useammassa sijassa. Verbimuodoissa tunnukset ovat komple- 
mentaarisessa distribuutiossa ja vapaata vaihtelua ei käytännössä enää 
ole (agenttipartisiippia lukuunottamatta). Täydennysjakauma ylläpitää 
kahta tunnusta, mutta verbien osalta voi olla, että tunnuksen funktio 
ennen pitkää käy epäselväksi. Tämä on sikäli epätoivottavaa, että tunnus 
erottelee sama- ja erisubjektisen referentiaalisen rakenteen (kuuli sano- 
vansa / (heidän) sanovan). 

Lopuksi voi todeta, että possessiivisuffiksien tunnusten variaatiota 
koskeva muutos on yksi harvoista suomen kielessä tapahtuneista muu- 
toksista, jonka kestoa voidaan arvioida vuosissa: variaation väheneminen 
ja komplementaarisen distribuution synty on vienyt yli 200 vuotta. 
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YHTEENVETO JA JOHTOPAATOKSET 

Olemme tarkastelleet possessiivisuffiksien käyttöä sekä kehitystä eri 
aikoina ja eri tekstilajeissa. Tutkimuksemme osoittaa, että possessiivi- 
suffiksin käyttö on tarkasteltavina vuosikymmeninä kirjoitetussa kieles- 
sä samankaltaista eikä suuria muutoksia ole nähtävissä. Sen sijaan eri 
tekstilajien välillä voidaan havaita selkeitä eroja. 

Lehtikielessä kolmannen persoonan suffiksi on vallitseva vuosikym- 
menestä toiseen, kun taas nuorten kirjoitelmissa, oppikirjoissa ja fiktios- 
sa sen osuus on 15—20 prosenttiyksikköä pienempi. Oppikirjoissa koros- 
tuu yksikön toisen persoonan tunnus erilaisten tehtävänantojen takia, 
kirjoitelmissa puolestaan korostuu omakohtaisuus ensimmäisen per- 
soonan muodossa. Sanaluokkajakauma paljastaa, että noin kaksi kol- 
masosaa kaikista suffiksillisista esiintymistä on substantiiveja, runsaat 
10 prosenttia adverbeja ja noin 10 prosenttia verbejä. Sanaluokkien si- 
sällä on havaittavissa pientä laskua substantiiveissa ja vastaavasti pientä 
nousua adverbeissa. Suffiksilliset verbit puolestaan liittyvät kompleksi- 
seen kielenkäyttöön ja tekstilajien välillä voi havaita vaihtelua siten, että 
esimerkiksi oppikirjat välttävät kompleksisia verbi-ilmauksia. Sanaluo- 
kittainen tarkastelu osoittaa, että substantiiveissa monikon ensimmäi- 
sen persoonan käyttö vähenee selvästi. Yksikön toinen persoona on 
kauttaaltaan harvinainen lukuun ottamatta oppikirjoja. Yksikön kolmas 
persoona on yleisin 2000-luvun fiktiossa. Sekä verbeissä että adverbeis- 
sa yleisjakauma näyttää samantapaiselta ja yksikön kolmannen persoo- 
nan suffiksi on jälleen yleisin fiktiossa. Verbiluokkien analyysi funktion 
mukaan osoittaa, että suffiksia esiintyy eniten finiittiverbin kanssa sa- 
manaikaista tekemistä ilmaisevissa rakenteissa. Myös tekstilajierot ovat 
jälleen esillä: referentiaalirakenne on yleisin sanomalehtikielessä ja tem- 
poraalirakenne muissa. Selvää ajallista muutosta ei ole havaittavissa. 
Kehityksellisesti suffiksit koululaisilla lisääntyvät. 

Indeksisanojen analyysi osoittaa, että odotuksenmukaisesti suffiksi 
on yleisempi eroamattoman omistussuhteen yhteydessä kuin eroavan. 
Selkeää ajallista muutosta ei ole taaskaan havaittavissa vaan suffiksin 
yleisyys on vuosikymmenestä toiseen melko samanlainen, sukulais- 
sanoissa voidaan havaita pientä nousua. Sen sijaan ruumiinosaa nimeä- 
vien sanojen yhteydessä käyttö on laskenut tasaisesti. Erittäin mielen- 
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kiintoisia puhutun kielen tutkimusten perusteella tehtyjen ennusteiden 
kannalta ovat tapaukset, joissa omistussuhteen ilmaisuun riittää pelkkä 
persoonapronomini, sillä ennusteiden mukaan suffiksi jäisi tällaisissa 
tapauksissa pois. Täysin ennusteiden vastaisesti 321:n esimerkin joukos- 
ta löytyy kuitenkin vain 5 tapausta, joissa suffiksi jää pois, ja vain yksi 
näistä on niin sanottu aito tapaus. Tämä luonnollisesti tarkoittaa, että 
melko muodollisessa kontekstissa kirjoittavat ovat vielä pystyneet käyt- 
tämään possessiivisuffikseja puhutun kielen konventioista poiketen. 
Epämuodollisemmissa konteksteissa he hyvinkin toimisivat toisin. Vii- 
meiseksi analysoimme vielä yksikön kolmannen persoonan tunnuksen 
vaihtelua. Tuloksena on, että tunnusten täydennysjakauma on selkiyty- 
nyt. Vapaata vaihtelua esiintyy vain partitiivissa ja paikallissijoissa mut- 
ta vähän. Sanamuotoesiintymien perusteella nsA-tunnus on yleisempi, 
vaikka Vn-tunnus esiintyykin useammassa sijassa. 

Puhutun kielen tutkimusten sekä kirjoitetussa kielessä tehtyjen 
huomioiden ja esimerkkien pohjalta tehtyjen ennusteiden perusteella 
possessiivisuffiksien käytössä tulisi näkyä selkeitä vähenemisen merk- 
kejä. Tutkimuksemme ei tue näitä havaintoja. Täten esimerkiksi Ikolan 
(1992) ennuste suffiksien vähenemisestä lehtikielessä kumoutuu. Erit- 
täin mielenkiintoinen tulos on myös se, että indeksisanoissa suffiksin 
käyttö on täysin ennusteiden vastaista, koska suffiksittomuuden leviämi- 
sen yhdeksi syyksihän on esitetty sitä, että se vanhastaan puuttuu jo 
sellaisissa tapauksissa, joissa omistusmuoto ilmaisee perhettä, yhteisöä 
tai asuinpaikkaa. On siis mahdollista, että puhutussa kielessä havaittu 
muutostendenssi ei ole vielä ehtinyt levitä (muodolliseen) kirjoitettuun 
kieleen tai että se on hidastunut. Koska havaintoja suffiksittomuuden 
lisääntymisestä on jo 1960-luvulta, olisi muutoksen nopeus tässä ta- 
pauksessa huomattavasti hitaampi kuin mitä on esitetty puhutun kielen 
osalta. Toinen vaihtoehto on se, että tehdyt ennusteet perustuvat yksittäi- 
siin esimerkkeihin ja niistä liian pitkälle vedettyihin johtopäätöksiin. On 
täten mahdollista, että muutos ei tule etenemään kirjoitettuun kieleen 
ainakaan sellaisenaan. 

Tutkimuksemme osoittaa myös sen, että suffiksin käyttöä ja käytön 
kehitystä ei voi analysoida pelkästään yhden tekstilajin perusteella, sillä 
suffiksin käyttö vaihtelee sekä teksti- että tyylilajeittain. Suffiksin käyttöön 
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vaikuttaa myös sen funktio joko omistuksen tai referentiaalisen viittauk- 
sen ilmaisimena. Aineiston perusteella voi myös yleistää, että suffiksit 
ovat yleisempiä kertovassa kuin erittelevässä, arvioivassa tekstityypissä. 
Tulos antaa aihetta olettaa, että samankaltaisia eroja voi havaita muis- 
sakin kielenpiirteissä. Ajallisen muutoksen tutkimuksissa on siis huo- 
mioitava niin tekstilajien erot kuin tyylilliset erot, ainakin kirjoitetun kie- 
len kohdalla. Tämän havainnon on aiemmin tehnyt mm. Biber (1998) 
kirjoitetun ja puhutun kielen välistä suhdetta käsittelevässä tutkimuk- 
sessaan. Mielenkiintoinen kysymys on, voiko tuloksesta vetää puhuttua 
kieltä koskevia johtopäätöksiä. Puhutussa kielessä ei voi erottaa tekstila- 
jeja samalla tavalla kuin kirjoitetussa kielessä, mutta kuten Hakulinen 
(2003) toteaa, puhuttu kielikään ei ole yhtenäinen kielimuoto. 

Yhdeksi possessiivisuffiksin käytön vähenemisen syyksi on esitetty 
sen redundanttisuus tietyissä asemissa, mihin tässäkin tutkimuksessa 
on viitattu. Toisaalta samassa yhteydessä on yleiskommenttina todettu, 
että possessiivijärjestelmän kaltaiset kongruenssisysteemit eivät edusta 
redundanttia tietoa, koska ne nopeuttavat prosessointia. Tätä tulisi ehkä 
pohtia laajemminkin: ovatko reduntanteiksi ajatellut kielenpiirteet to- 
della redundantteja? Ainakin muutoksen tutkimuksen kannalta tämä 
lienee olennainen kysymys. Esimerkiksi Linden (1959) tuo esiin selvyy- 
den, suhteiden täsmentämisen ja vahvistamisen sekä ilmaisuvoiman 
selittävinä tekijöinä pohtiessaan esimerkkien keinoin tapauksia, joissa 
suffiksi epäodotuksenmukaisesti joko jätetään pois tai liitetään mukaan. 
Tällaisissa tapauksissa olisi ehkä syytä pohtia myös prosessoinnin vai- 
kutusta. 


Lopuksi 


Tässä tutkimuksessa on tarkasteltu meneillään olevaa kielenmuutosta 
kirjoitetussa kielessä yhtäältä selvittämällä kirjoitetun ja puhutun kielen 
välistä suhdetta ja toisaalta analysoimalla possessiivisuffiksin käyttöä ja 
kehitystä eri vuosikymmeninä korpusten avulla. Kirjoitetun ja puhu- 
tun kielen välisen suhteen teoreettisessa tarkastelussa on korostettu 
kirjoitetun ja puhutun kielen samanlaisuutta ja argumentoitu sellaisia 
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näkemyksiä vastaan, jotka ylikorostavat niiden erilaisuutta. Possessiivi- 
suffiksin korpusanalyysi puolestaan tuo esiin kirjoitetun ja puhutun 
kielen erilaisuuden, joka tosin kietoutuu niiden samanlaisuuden ympä- 
rille. Tämä voidaan ilmaista selkeämmin esimerkiksi toteamalla, että 
sekä kirjoitetussa että puhutussa kielessä käytetään possessiivisuffikseja 
(= samanlaisuus) mutta että niitä saatetaan käyttää hieman eri tavalla 
(= erilaisuus). 

Tutkimuksemme tulokset eivät tue ennusteita, joiden mukaan pos- 
sessiivisuffiksi olisi katoamassa suomen kielestä. Ikolan (1992) ennuste 
suffiksin käytön vähenemisestä ei tutkimuksemme mukaan osu oi- 
keaan. Sen sijaan Paunosen (1995) ennusteeseen suffiksin katoamisesta 
Helsingin puhekielestä tutkimuksellamme ei voi ottaa suoraan kantaa. 
On kuitenkin vaikea kuvitella, että jos suffiksia käytetään jatkossa edes 
suurin piirtein entiseen tapaan esimerkiksi lehtikielessä, se tulisi koko- 
naan katoamaan puhekielestä, varsinkin kun otetaan huomioon tapauk- 
set, joissa suffiksin asema on vahvempi. 

Cameron (1997 [1990]) kritisoi sosiolingvistien tapaa selittää kielen- 
piirteiden ja kielenulkoisten tekijöiden välisiä korrelaatioita näkemyk- 
sellä, jonka mukaan kieli heijastaa yhteiskuntaa. Vaikka Cameronin 
varsin aiheellinen kritiikki kohdistuukin ensi sijassa selittämiseen, voi- 
daan myös itse näkemystä siitä, että kieli heijastaa yhteiskuntaa, kriti- 
soida. Voidaan esimerkiksi esittää, että kieli ei todellisuudessa heijasta 
yhteiskuntaa vaan on pikemminkin osa sitä, minkä seurauksena kieltä 
ei välttämättä tulisi tai voida erottaa yhteiskunnan rakenteista. On totta, 
että kieli ei ainoastaan heijasta yhteiskuntaa vaan myös vaikuttaa siihen 
takaisin, mutta heijastamisen kieltäminen on liioittelua. Otetaan esimer- 
kiksi ilmaisut kotimaamme ja taloutemme, jotka oman tutkimuksemme 
mukaan olivat hyvin yleisiä 1950- ja 1970-luvun teksteissä. Tällaisten 
ilmausten käytön väheneminen johtuu yhteiskunnallisista (eli kielen- 
ulkoisista) tekijöistä, mutta nämä tekijät heijastuvat kieleen siten, että 
possessiivisuffiksien käyttö vähenee monikon ensimmäisessä persoonas- 
sa. Kielenulkoiset tekijät vaikuttavat puhujien kielelliseen käyttäytymi- 
seen, minkä seurauksena kielessä tapahtuu muutoksia. Kieli ei ole täten 
erillään yhteiskunnasta mutta ei myöskään erottamaton osa sitä. Mikäli 
näin ei olisi, olisi autonominen kielitiede mahdotonta (mitä se ei ole). 
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Tutkimuksessamme tulee myös esiin kysymys kielenmuutoksen no- 
peudesta. Yllä on esimerkiksi todettu, että possessiivisuffiksien tunnus- 
ten osalta komplementaarisen distribuution synty on vienyt yli 200 vuot- 
ta. Suffiksien käytön vähenemistä puhutussa kielessä on kuvattu no- 
peasti tapahtuvaksi muutokseksi, jonka leviämisestä kirjoitettuun kie- 
leen on merkkejä jo 1960-luvulta. Tästä on kuitenkin jo 6o vuotta, ja 
koska tulostemme perusteella suffiksien käytössä kirjoitetussa kielessä 
ei näy suurempia vähenemisen merkkejä, kovin nopeasta muutoksesta 
ei voi olla kysymys. On myös mahdollista, että puhutussa kielessä ha- 
vaittu muutos ei koskaan tule edes etenemään kirjoitettuun kieleen 
vaan kyse on pysyvästä vaihtelusta, jossa suffiksin poisjättö kirjoitetussa 
kielessä on joko tarkoituksellista tai perustuu huolimattomuuteen ja 
kielenhallinnan puutteeseen. 

Muutoksen nopeus on ylipäätään varsin monimutkainen kysymys. 
Sosiolingvistisissä tutkimuksissa on todettu, että näennäisaikainen tut- 
kimus saattaa aliarvioida muutoksen nopeutta (ks. esimerkiksi Labov 
1994, 112; Sankoff 2006; Sankoff & Blondeau 2007). Toisaalta Wagner 
& Sankoff (2011) ovat havainneet, että näennäisaikainen tutkimus saattaa 
myös yliarvioida muutoksen nopeuden. Selittäväksi tekijäksi nostetaan 
yleensä yksilöiden käyttäytyminen: jos yhteisössä on meneillään muu- 
tos ja jos yksilöt muuttavat kieltään meneillään olevan muutoksen mu- 
kaisesti, on muutos nopeampaa kuin mitä näennäisaika antaisi olettaa. 
Vastaavasti jos yksilöt muuttavat kieltään yhteisössä meneillään olevan 
muutoksen vastaisesti, on muutos hitaampaa kuin mitä näennäisaika 
antaisi olettaa (ks. Paunonen 2005, 16; Laasanen 2016). Luultavasti tul- 
kintoihin vaikuttaa myös se, missä vaiheessa oletettu muutos on (ks. 
Laasanen 2010). Lisäksi on huomattava, että näennäis- ja myös reaali- 
aikaisten tutkimusten ajallinen läheisyys muutokseen saattaa hämärtää 
kuvaa muutoksesta siinä mielessä, että varianttien edustuksissa havaitut 
muutokset saattavat saada muutoksen näyttämään hitaammalta tai no- 
peammalta kuin mitä se todellisuudessa on. 

Meneillään oleva kielenmuutos puhutusta kielestä kirjoitettuun on 
monimutkainen ilmiö, sillä siinä sekoittuvat keskenään muutos, kehi- 
tykselliset tekijät ja modaliteettien väliset erot. Nämä tekijät korostuvat 
tarkasteltaessa nuoria puhujia, joita on jo pitkään pidetty muutoksen 
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airuina (ks. esimerkiksi Labov 2001; Aitchison 2003, 739; Tagliamonte 
& D'Arcy 2009). Nuoret puhujat ovat usein muutoksen kärjessä, mutta 
samanaikaisesti nuorten puhujien kielenkehitys saattaa olla vielä kesken 
ja he eivät välttämättä vielä hallitse kirjoitetun kielen mallin mukaista 
kielenkäyttöä yhtä hyvin kuin vanhemmat. Lisäksi aikuistuessaan he 
usein muuttavat kielenkäyttöään kohti standardia (ks. Chambers 1995, 
177—185) tai kuten Anttila (1989 [1972], 194) kirjoittaa, perinne voittaa. 
Muutoksen tunnistaminen tästä sekamelskasta saattaa olla varsin haas- 
teellista. 
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Johdanto 


Kirjoittamisen taitodiskurssia painottava opetuksen, tutkimuksen ja ar- 
vioinnin perinne on Suomessa vahva. Tama nakyy esimerkiksi mennei- 
den vuosikymmenten opetusuunnitelmien perusteissa, oppimateriaa- 
leissa ja arviointitottumuksissa sekä kielitieteen, erityispedagogiikan ja 
kasvatustieteen ja osin myös psykologian aloilla jo tehdyn tutkimuksen 
valinnoissa kuten aineistoissa, käytetyissä metodeissa ja teoreettisen vii- 
tekehyksen hahmottelussa (ks. myös Kauppinen, Pentikäinen, Hankala, 
Kulju, Harjunen & Routarinne 2015). Taitodiskurssia painottaneessa 
opetuksessa korostuvat yksilön taidot. Kirjoittamista tarkastellaan ensi- 
sijaisesti kielellisten taitojen soveltamisena kirjoittamiseen, ja päähuo- 
mio kohdistuu kirjalliseen tuotokseen, kuten oikeinkirjoitukseen, teks- 
tien yhtenäisyyteen, tarkkuuteen ja virheettömyyteen. Tätäkin diskurssia 
kiistatta tarvitaan, mutta sen asema ansaitsee uudelleen arviointia. (Ks. 
kirjoittamisen diskursseista Ivanič 2004.) 
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Taitodiskurssin puutteena voidaan pitää erityisesti siihen usein vahin- 
tään implisiittisesti liitettyä oletusta ikään kuin vaihtelemattomista, tilas- 
teesta toiseen siirrettävissä olevista taidoista. Ongelmaksi taitodiskurssi 
muodostuu, mikäli sitä painotetaan opetuksessa ja arvioinnissa muiden 
näkökulmien kustannuksella ja mikäli unohdetaan yksilöiden erilaiset 
valmiudet, kirjoittamisen monet merkitykset ja päämäärät sekä kirjoitta- 
mistilanteiden ja -kontekstien vaihtelevuus. Kirjoittamisen opetuksen, 
arvioinnin ja tutkimuksen valinnat kytkeytyvät laajempaan kirjoittamis- 
käsitykseen, joka on muovannut niin kierrätettyjen käytänteiden, kir- 
joittamista koskevien uskomusten ja puhumisen tapojen kuin opetusta 
ohjaavien määräysasiakirjojen, arviointimallien ja oppikirjojenkin sisäl- 
töjä. (Ks. esimerkiksi Erra & Svinhuvud 2017). Käsitys kirjoittamisesta 
ja kirjoitustaidosta on erityisesti tuoreimman opetussuunnitelmauudis- 
tuksen (OPH 2014) myötä laajentunut ja tutkimus moninaistunut jo 
tätä ennemmin. Yksilön taitoon ja erityisesti kirjoittamisen tarkkuuteen 
kiinnittyvä kirjoittamiskäsitys painottuu kuitenkin yhä vahvasti opetuk- 
sen ja arvioinnin käytänteissä sekä näistä käytävissä keskusteluissa, 
minkä olen havainnut myös työssäni kielen opettajana ja opettajankou- 
luttajana. Näkökulma onkin tärkeä, sillä tekstittyneessä yhteiskunnassa 
toimimiseen tarvitaan vahvaa kirjoitustaitoa ja erilaisiin arviointitarpei- 
siin monenlaisia, myös yksilökeskeisiä, kirjoitustaidon arviointitapoja. 
Samalla tarvitaan ymmärrystä kirjoittamisen moninaisuudesta sekä kir- 
joitustaidon dynaamisesta ja lukuisiin vaikuttaviin tekijöihin kietoutu- 
vasta luonteesta (ks. esimerkiksi Ivanič 2004; Kauppinen ja muut 2015). 

Vaikka taitodiskurssilla on Suomessa ollut kaikessa kieltenopetuk- 
sessa vahva asema, puuttuu tutkimukseen perustuvaa tietoa — johon 
opetusta ja arviointia voitaisiin suhteuttaa — kirjoittamistaidon kehitty- 
misestä erityisesti alkuopetusvaiheen jälkeen. Alakouluikäisten oppilai- 
den kirjoittamisen tarkkuutta on Suomessa tutkimuksen keinoin aikai- 
semmin tarkasteltu lähinnä suomea äidinkielenä puhuvien lasten 
näkökulmasta. Tyypillisesti on tutkittu kontrolloitua kirjoittamista, 
kuten toisto- tai sanelukirjoittamisessa sanatasolla ilmenevää teknisen 
kirjoittamisen taitoa, ja kehyksenä on usein ollut lukemisen ja kirjoitta- 
misen erityisvaikeuksiin liittyvä tutkimus (ks. esimerkiksi Kulju & Mäki- 
nen 2009; Aro, Eklund, Leppänen & Poikkeus 2011; Kauppinen ja muut 
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2015). Myös alakouluikäisten tuottavaa kirjoittamista on jo aikaisemmin 
tutkittu erilaisin painotuksin (esimerkiksi Saarela 1997; Mäki 2002; 
Mäkihonko 2006; Pajunen 2012). Suomi toisena kielenä -oppijoiden 
kehittyvää kirjoitustaitoa on samassa ikävaiheessa kuitenkin tarkasteltu 
vasta muutamissa tutkimuksissa (ks. Halonen 2009; Honko 2013; Sikiö, 
Siekkinen & Holopainen 2016). 

Tässä luvussa tarkastelen alakouluikäisten lasten tuottavaa kirjoitta- 
mista, erityisesti sen tarkkuuden kehittymistä yhdessä kirjoitustaidon 
kiivaassa kehitysvaiheessa vuosiluokilta 2—3 vuosiluokille 5-6. Lisäksi 
tarkastelen kirjoittamisen tarkkuuden suhdetta tuottavan kirjoittamisen 
muihin osataitoihin. Tutkimusryhmässä on sekä suomea äidinkielenä 
että toisena kielenä puhuvia koululaisia eri puolilta Suomea. S2-ryhmäs- 
sä vertaan kirjoittamisen tarkkuutta ja sen kehittymistä myös kirjoittajan 
suomen kielen sekä oman äidinkielen taidon tasoon. 

Tutkimukseni kytkeytyy osaksi kielitaidon arviointitutkimusta, tar- 
kemmin osaksi kirjoitustaidon arviointia (Huhta & Hilden 2016). Kont- 
rolloituun kirjoittamiseen nähden tuottava kirjoittaminen antaa katta- 
vamman kuvan oppijan toiminnallisesta kirjoitustaidosta, esimerkiksi 
kyvystä ilmaista itseään kirjallisesti. Koulunkäynnin alkuvaiheessa koko- 
naisen tekstin tuottaminen ja keskittyminen yhtä aikaa sekä tekstin si- 
sältöön että kielelliseen muotoon on useimmille kirjoittajille toisaalta 
vielä vaikeaa (Mäki 2002). Kirjoitustaidon mittarina tuottavan kirjoitta- 
misen tehtävät ovatkin kirjoittajia varsin hyvin erottelevia, minkä vuoksi 
ne sopivat kontrolloitua kirjoittamista paremmin etenkin alkuopetus- 
vaihetta myöhemmän vaiheen ja tyypillisesti kehittyvän kirjoitustaidon 
arviointiin (ks. myös Aro ja muut 2011). Kielitaidon vertailumittarina 
käytän kirjoittajien sanastollisia taitoja mittaavia sanastotehtäviä (Honko 
2013) sekä kirjoittajilta ja heidän opettajiltaan kerättyä kyselyaineistoa. 

Etenkin S2-oppilaiden oman äidinkielen taidot huomioivaa kielitai- 
don arviointitutkimusta on Suomessa toistaiseksi tehty hyvin niukasti. 
Kansallisen koulutuksen arviointikeskuksen selvityksen mukaan perus- 
opetuksen päättövaiheen oppilaat ovat oman arvionsa mukaan yleensä 
saavuttaneet vähintään hyvät vuorovaikutustaidot sekä suomen kielellä 
että omalla äidinkielellään (Kuukka & Metsämuuronen 2016). Kielten 
käyttöalassa, taidoissa ja merkityksissä on kartoituksen mukaan yksilöl- 
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listä ja tilanteistakin vaihtelua, mutta kirjallisen viestinnän taidot ovat 
tarkastellussa ikäluokassa keskimäärin vahvemmat suomen kielessä 
kuin omassa äidinkielessä (mts. 73-77). Tähän vaikuttanee ennen kaik- 
kea vähäisemmät mahdollisuudet saada opetusta, ohjausta ja harjoitus- 
ta omalla äidinkielellä lukemiseen ja kirjoittamiseen. Kartoituksessa ei 
kuitenkaan ole tarkasteltu monikielisiä resursseja yksilöllisellä tasolla eli 
esimerkiksi tietyn kirjoittajan kirjoitustaitoa omalla kielellään suhteessa 
suomen kielen kirjoitustaitoon. 

Kriittisen pedagogiikan mukaan kirjoittamisella voidaan viitata tai- 
toon mutta myös luovuuteen tai prosessiin ja sitä voidaan tarkastella 
lukuisista eri näkökulmista, kuten tekstilajien tuottamisena, sosiaalisten 
käytänteiden noudattamisena tai sosiopoliittisena toimintana (Ivanicin 
2004 pohjalta Erra & Svinhufvud 2017). On siis muistettava, että ko- 
konaisvaltaisessa kirjoittamisen tutkimuksessa ja opetuksessa kirjoit- 
tamisen tarkkuus on vain yksi osa kirjoitustaitoa ja että taitodiskurssi 
puolestaan on vain yksi näkökulma kirjoittamiseen (Ivanič 2004, 225). 
Vaikka tämä luku kohdistuu kirjoittamisen tarkkuuteen, tarkoitus ei ole 
vahvistaa jo ennestään vahvan taitodiskurssin asemaa kirjoittamisen 
opetuksessa. Sen sijaan tavoitteena on auttaa hahmottamaan kirjoittami- 
sen tarkkuuden tyypillistä kehittymistä ja siihen vaikuttavia syitä osana 
kirjoittamisen kokonaistaitoa, erityisesti toisella kielellä kirjoitettaessa. 

Kun tarkkuuden kehitystä havainnoidaan diakronisesti ja samalla ote- 
taan huomioon kielenoppimisprosessin eteneminen muilla kielitaidon 
eri osa-alueilla, on mahdollista saada tietoa sekä tyypillisestä kielenkehi- 
tyksestä että kielenkehityksen tukemisen tarpeista (ks. esimerkiksi Ellis 
& Barkhuizen 2005; Martin 2010; Martin, Mustonen, Reiman & Seilo- 
nen 2010; Slabakova 2016). Kirjoittamistaidon tyypilliseen kehityskul- 
kuun ja haasteisiin tutustuminen auttaa esimerkiksi ymmärtämään, 
millaiset seikat ovat kirjoittamisen kannalta ajankohtaisia tietyssä ikävai- 
heessa. Tämän tutkimuksen tieto voikin auttaa paitsi tunnistamaan kir- 
joittamisen tarkkuuteen liittyvän tuen tarpeita peruskoulun alaluokilla 
myös kohdentamaan tukea oikein ja vähentämään tarpeetonta huolta 
tilanteissa, joissa kehkeytyvään kielitaitoon liittyy tilapäisesti myös epä- 
tarkkuus. 
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TUTKIMUSKYSYMYKSET JA VIRHEEN KASITE 
Tässä tutkimuksessa kirjoittamisen tarkkuutta tarkastellaan aluksi ling- 
vistisen analyysin avulla. Sen jälkeen tuloksia peilataan kirjoittajakohtai- 
siin taustatietoihin sekä kirjoittamisen muihin osataitoihin. Tutkimus- 
kysymyksiä on neljä: 
1) Miten kirjoittamisen tarkkuus kehittyy seurantajaksolla alakoulun 
aikana? 
2) Millaiset virheet ovat yleisimpiä ja mitkä tekijät niitä selittävät? 
3) Onko kirjoittamisen tarkkuudessa eroja eri kirjoittajaryhmien välillä? 
4) Onko kirjoittamisen tarkkuus yhteydessä muihin kirjoittamisen 
osataitoihin ja S2-ryhmässä tarkemmin kirjoittajan suomen kielen 
tai oman äidinkielen taitoon kielitaidon eri osa-alueilla? 


Esittelen seuraavaksi tutkimuksen keskeiset käsitteet, perehdytän tark- 
kuuteen kehityksellisenä mittarina ja kokoan lyhyesti aiempaa tutkimus- 
ta. Aineisto ja tutkimusmetodi esitellään johdannon lopuksi. Tulokset 
esitetään analyysiluvuissa ja kootaan pohtien päätäntöluvussa. 

Kun tutkitaan kielenkäytön tarkkuutta, otetaan samalla väistämättä 
kantaa siihen, että kieli ei aina täytä tarkan vaatimuksia. Kielellisiä epä- 
tarkkuuksia on nimetty ja määritelty lukemattomin eri tavoin, mutta 
eniten käytetty, joskin usein kovin ohuesti määritelty, lienee virheen 
käsite. Hieman yksinkertaistaen virheellä tarkoitetaan eroa odotuksen- 
mukaisen ja toteutuneen muodon välillä eli esimerkiksi konventionaa- 
lisesta poikkeavaa kieliopillista muotoa, sanajärjestystä tai sanavalintaa. 
Englannin kieleen keskittyvässä toisen kielen oppimisen tutkimuksen 
perinteessä keskeistä on määrittelyssä ollut toistuvien ja satunnaisten 
poikkeamien erottaminen toisistaan (Corder 1967). Kiinnostavaa on, 
että suomen kielen taitoon kohdistuvissa tutkimuksissa on ollut varsin 
yleistä luokitella ja nimetä virheitä määrittelemättä kuitenkaan tarkem- 
min itse virheen käsitettä. Ensimmäisessä suomi toisena kielenä -alan 
väitöskirjassa Martin (1995) kirjoittaa, että virheellä (error) on viitattu ni- 
menomaan toisen kielen oppijan puheessa tai kirjoituksessa ilmenevään 
taidon puutteeseen, joka kontrastoituu äidinkielisen puhujan tarkkaan 
tai korkeintaan lipsahduksia (slips) sisältävään kielenkäyttöön. Tämä nä- 
kemys ei nähdäkseni kuitenkaan ylety edellä mainittuun äidinkielen ke- 
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hityksen varhaisvaiheen tutkimukseen. Esimerkiksi Mäkihonko (2006) 
sekä Havukainen ja Salmi (2011) käyttävät virheen käsitettä synonyymi- 
na kirjoitusvirheelle tutkimuksissaan, jotka käsittelevät tuottavan kirjoi- 
tustaidon varhaisvaiheen kehittymistä. 

On huomattava, että kielellisesti tarkkakaan muoto ei välttämättä ole 
sosiaalisesti hyväksyttävä, sillä kaikki virheettömät muodot eivät ole va- 
kiintuneet kaikkiin kielimuotoihin ja kielenkäyttötilanteisiin; virheelli- 
nen muoto puolestaan voi olla tilanteisesti aivan toimiva. Neutraalissa 
puheessa sanommekin esimerkiksi juuri tänään, puolukoiden kanssa ja 
järjetön mies mutta luultavasti emme aivan tänään, poulukkojen kansa 
tai hullu ukko, vaikka kaikki muodot olisivatkin käyttöyhteydessään ym- 
märrettäviä. 

Virheet kiinnostavat sekä maallikoita että kielentutkijoita, koska ne 
poikkeavat tutusta tai tavanomaisesta ja ovat usein helposti havaittavissa. 
Kielivirheet mutta myös niistä puhuminen nostattaa helposti voimak- 
kaita tunteita, sillä virheiden tarkasteluun liittyy aina myös arvottamista 
ja ideologista painolastia. Virheiden ilmeisin merkitys arjessa perustuu 
siihen, että ne voivat aiheuttaa vuorovaikutuksessa kitkaa kuten tarken- 
nuspyyntöjä, oikean muodon hakemista, epäröintejä ja keskustelun kat- 
keilua. Vahingollisimpia virheitä eivät kuitenkaan yleensä ole huomion 
kohteeksi nousevat virheet vaan ne, jotka sivuutetaan ja joiden seurauk- 
sena vuorovaikutukseen osallistuneet voivat tahoillaan jäädä väärän ym- 
märryksen varaan. 

Koska vuorovaikutus perustuu yksittäisten sanojen ja sananmuotojen 
sijaan huomattavasti laajempien kielellisten ja ei-kielellisten kokonai- 
suuksien tulkintaan, kielivirheet eivät aina ole vaaraksi merkityksen vä- 
littymiselle. Tarkkuus on silti tulkinnan sujuvuuden kannalta eduksi ja 
tietyissä konteksteissa sitä suorastaan vaaditaan. Esimerkiksi lääkäriltä 
voidaan valta-asemansa ja vastuullisen työnkuvansa vuoksi edellyttää 
tarkempaa kielenkäyttöä kuin monessa muussa ammatissa toimivalta. 
Ohjaavien ja velvoittavien tekstien itsenäinen laatiminen ja tulkinta taas 
edellyttävät lääkäriltäkin suurempaa tarkkuutta kuin vaikkapa epämuo- 
dollisempi vuorovaikutus tai työparin tuella toimiminen (Tervola 2019). 
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Kielenkäytön tarkkuus on hyväksi silloin, kun on tarve ilmaista itseä, 
tulla ymmärretyksi ja ymmärtää muita täsmällisesti. Lisäksi sillä on 
merkitystä sosiaalisen aseman ja hyväksyttyyden näkökulmasta: vir- 
heitä tekevä voidaan tulkita esimerkiksi huolimattomaksi ja välinpitä- 
mättömäksi, kieli- ja kulttuuritaidoltaan muita heikommaksi, joskus 
myös vähemmän luotettavaksi tai älykkääksi (ks. esimerkiksi Jessmer 
& Anderson 2001; Kreiner, Schnakenberg, Green, Costello, & McClin 
2002; Vignovic & Thompson 2010). Jos virheitä tarkastellaan suomen 
kielen oppimisen kannalta, tarkkuuden kehittymistä voidaankin pitää 
yhtenä tavoittelemisen arvoisena ja edistymisestä kertovana kielitaidon 
piirteenä (ks. myös Brunni, Jantunen & Skantsi 2019), johon sisältyvät 
niin oikean rekisterin eli tilanteeseen sopivan kielimuodon valinta kuin 
kielellisten ilmausten rekisterinmukainen käyttö. 


OPPIJANKIELEN TARKKUUS TUTKIMUKSEN KOHTEENA 

Oppijankielentutkimuksessa virheanalyyttinen lähestymistapa saavut- 
ti nopeasti vankan aseman 1960- ja 1970-lukujen taitteessa Stephen 
Corderin artikkelin The significance of learner's errors (1967) innoit- 
tamana ja on sittemmin saanut osakseen paljon sekä ansaittua että 
ansaitsematonta kritiikkiä. Matka virheanalyyttisen tutkimuksen alku- 
ajoista nykyhetkeen on kuitenkin ollut pitkä: aluksi virheitä tarkastel- 
tiin lähinnä ”täydellisen kielisysteemin” hallinnan puutteina ja niiden 
syitä etsittiin 1960-luvun kontrastiivisen analyysin hengessä melko 
suorasukaisesti esimerkiksi puhujan äidinkielestä (Lado 1957; ks. myös 
esimerkiksi Gass & Selinker 2008, 89-90). Sittemmin on kiinnostuttu 
enemmän oppijankielen kehityksellisestä tarkastelusta. Esimerkiksi 
DIALANG-arviointijärjestelmään liittyvässä tutkimuksessa tarkkuuden 


75 L2-tutkimuskentällä ei silti liene koskaan vallinnut täyttä yhteisymmärrystä siitä, mille kielitaidon 
osa-alueille äidinkielen vaikutukset voivat virheinä ilmentyä ja milloin on kyse kielten välisten suhtei- 
den aiheuttamista virheistä (interlingual errors), milloin kohdekielen systeemin sekoittamisesta (intra- 
lingual errors) — ja kuinka mahdollinen tai tarpeellinen tämän eron tekeminen kulloisessakin tilanteessa 
on. 

76 Varhaisen virheanalyyttisen tutkimuksen päämääriä on kritisoitu osin aiheettomastikin, sillä jo Corder 
(1967, 167) itse korosti virheiden tarkastelussa kielen oppijan tukemisen näkökulmaa: Kielen oppijan 
tekemät virheet ovat merkityksellisiä sekä kielen opettajalle, tutkijalle että oppijalle itselleen. Ne kerto- 
vat oppimisen vaiheista ja siitä, miten kieltä opitaan eli millaisia strategioita oppija esimerkiksi käyttää 
kieleen tutustuessaan. 
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(kielioppi, sanasto, oikeinkirjoitus) on havaittu korreloivan voimakkaasti 
aikuisten kielenoppijoiden sanavaraston koon kanssa (Alderson 2005, 
55, 89). Samansuuntaisia tuloksia on saatu muillakin arviointimetodeilla 
sekä aikuisten englanninoppijoiden kielestä (ks. esimerkiksi Meara & 
Milton 2003; Milton 2009, 171) että kouluikäisten S2-oppijoiden kieles- 
tä (Honko 2013). 

Dynaamisuuden myötä tarkasteltava ilmiö on muuttunut: kontekstis- 
taan irrotettujen virheiden sijaan on ryhdytty tutkimaan muun muassa 
kielenkäytön epäidiomaattisuutta, virheiden esiintymisympäristöjä sekä 
esiintymistiheyttä, kielellisen tarkkuuden suhdetta tekstin tulkintaan ja 
tavoitemuodon neuvottelemista vuorovaikutuksessa muiden kielenkäyt- 
täjien kanssa. Korpustutkimuksen keinot mahdollistavat nykyään paljon 
sellaista, mihin ei 1960- ja 1970-luvuilla ollut pääsyä, ja 2000-luvulla 
virheiden analyysi yhdistetään yhä useammin laajempaan kielitaidon 
profilointiin sekä ohjatun tai spontaanin kielenkäytön vaikuttavuuden 
arviointiin. 

Myös oppimis- ja kielikäsitykset ovat muuttuneet. Modernin virheana- 
lyyttisen tutkimuksen lähtöoletuksena on, että kaikki kielenkäyttäjät äi- 
dinkieleen ja kielenkehityksen vaiheeseen katsomatta tekevät virheitä 
ja että tarkkuus ei myöskään kehity suoraviivaisesti — vaan kielellisten 
valmiuksien uudistumiseen liittyy kokeiluja ja haparointia (ks. suomen 
oppijoiden kirjoittamistaidon kehittymisestä esimerkiksi Seilonen 2013; 
Mustonen 2015; Brunni ja muut 2019). Virheiden syynä voi olla huoli- 
mattomuus sekä se, ettei edes syntyperäisten aikuisten kielitaito auto- 
maattisesti noudata mitään standardiolemusta edes kieliopin osalta (ks. 
myös Chipere 2009, 190-191). Toiminnalliseen kielitaitokäsitykseen 
kuuluu ajatus siitä, että virheet itsessään myös edistävät oppimista, sillä 
ne mahdollistavat epämukavuusalueella toimimisen ja siten uuden op- 
pimisen ja voivat saada oppijan kiinnittämään huomiota kehkeytymäs- 
sä oleviin ilmaisuihin. Toisaalta aiemman tutkimuksen pohjalta tiede- 
tään, että virheet muuttuvat oppimisen edetessä: alkuvaiheessa tehdään 
enemmän rakenteellisia ja sanastollisia virheitä, myöhemmin poikkea- 
vuudet liittyvät lähinnä ilmiöiden yleisyyteen ja tyypillisiin esiintymis- 
ympäristöihin (Martin 2015). 
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TARKKUUDEN KEHITTYMINEN OSANA KARTTUVAA KIELITAITOA 
Kirjoitustaidon ja kirjoittamalla viestimisen opettelua on verrattu uuden 
kielen opettelemiseen (esimerkiksi Halonen 2009, 330). Kirjoittamista 
opetteleva lapsi voi toisaalta hyödyntää kirjoittamisessa puhutun kielen 
pohjalta oppimaansa tietoa esimerkiksi suomen kielen sanastosta ja ra- 
kenteista, tekstilajeista sekä vuorovaikutuskulttuurista. Mitä monipuoli- 
sempi lapsen kielellinen ympäristö on varhaislapsuudessa ollut, sitä 
vahvempi perusta hänellä on kouluiässäkin toimia kielellä joustavasti 
erilaisissa tilanteissa, kartuttaa ilmaisuvarantoaan ja oppia uusia taitoja, 
kuten kirjoittamista. Esimerkiksi äänne-kirjain-vastaavuuden oppimi- 
sessa ja äännekestojen merkitsemisessä auttaa, jos jo osaa suomen 
kielen äänteet sekä niiden lyhyen ja pitkän keston merkitystä erottavan 
tehtävän. Kertomustekstin kirjoittamisessa puolestaan on hyötyä siitä, 
jos on tutustunut kertomuksiin kuuntelemalla ja puhumalla. Kakkos- 
kielisellä puhujalla sekä suomen kielen systeeminen tieto että kielen 
käyttöön liittyvä kulttuurinen tieto on tyypillisesti kapeampaa kuin äi- 
dinkielisellä suomenpuhujalla. Syynä tähän ei ole kakkoskielisyys tai 
monikielisyys itsessään vaan vähäisempi kokemus. 

Kirjoitustaidon oppiminen edellyttää puhutun kielen ja kirjoitusjär- 
jestelmän yhteyden ymmärtämistä. Suomen kielen oppijalle tämä tar- 
koittaa muun muassa latinalaisaakkoston ja vastaavien äänteiden yhtey- 
den sekä kirjoitussuunnan hahmottamista ja oikeinkirjoitusnormeihin 
tutustumista sekä kykyä pukea omat ilmaisutarpeet kirjalliseen muo- 
toon. Taitodiskurssin näkökulmasta kirjoitustaitoon kuuluukin Mäen 
(2002, 17) mukaan kolme keskeistä osa-aluetta: kirjoituksen koostami- 
nen kirjoitusmerkkien eli grafeemien avulla, oikeinkirjoitus sekä sisäl- 
töjen tuottaminen eli varsinainen kirjoittaminen. Käsin kirjoittaessaan 
kirjoittamistaitoa harjoitteleva lapsi siis ikään kuin piirtää näkyviin aja- 
tuksiaan, samalla kun hän vielä harjoittelee kirjainten ja sanahahmojen 
muodostamista, tekstin asettelua sekä tuotettavan tekstilajin erityispiir- 
teitä. 

Luku- ja kirjoitustaidon tyypillisen kehityksen tunnistaminen on 
avain lukemisen ja kirjoittamisen erityisvaikeuksien tunnistamiseen 
(Matilainen 1993, 5). Kakkoskielisyys tuo kirjoittamiseen oman erityis- 
värinsä, johon vaikuttaa paitsi oppijan kielellinen tausta myös muun 
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muassa kulttuuriset ja sosiaaliset tekijät. Myös suomea äidinkielenään 
puhuva on koulun alkuvuosina vasta ottamassa kirjoittamista haltuun, 
ja kirjoituksen tuottaminen vie huomiota suunnitelmalliselta sisältöjen 
tuottamiselta (ks. esimerkiksi Matilainen 1993). Kirjoittamisen alkuvai- 
heessa on tyypillistä, etteivät sekä tarkka oikeinkirjoitus että eheän aja- 
tuskokonaisuuden luominen onnistu yhtä aikaa ongelmitta (Mäki 2002, 
40). Vaikka esimerkiksi kirjoittamisen sujuvuus kasvaa nopeasti, virhei- 
den määrä ei alkuopetuksen aikana juuri vähene (Mäkihonko 2006). 
Toisluokkalaisella voi vielä olla vaikeuksia esimerkiksi äännekestojen 
kirjoittamisessa ja aloitetun virkkeen jatkamisessa eheänä loppuun saak- 
ka ilman, että kyseessä olisi kielellinen erityisvaikeus (ks. myös Kulju 
& Mäkinen 2009). Tekstistä voi myös puuttua kirjaimia, ja sanavälien 
merkitsemisessä voi olla horjuntaa. Havukaisen ja Salmen (2011) aineis- 
tossa lähes puolet (45 %) toisluokkalaisten tuottavan kirjoittamisen epä- 
tarkkuuksista liittyi oikeinkirjoituksen konventioihin, 40 prosenttia 
äänne-kirjain-vastaavuuteen (mukaan lukien pitkien äännekestojen 
merkintä, lisämerkit, puuttuvat kirjaimet, rauniosanat, puuttuvat tavut, 
rotaatiot ja reversaalit) ja vajaa viidennes (17 %) lausetason ilmiöihin. 
Vähitellen, Matilaisen (1993, 70-72) mukaan viimeistään neljänneltä 
luokalta alkaen, kirjoittamisen suunnitelmallisuus lisääntyy ja oppilaalle 
alkaa muodostua syvempi käsitys sekä käsiteltävistä asiasisällöistä että 
tekstistä kokonaisuutena. 

Tiedetään, että erityisesti geminaattojen kirjoittaminen on äidinkie- 
lisellekin suomenpuhujalle alkuvaiheessa vaikeaa (Kulju & Mäkinen 
2009). Tämä voi liittyä auditiiviseen hahmottamiseen. Pitkä vokaali 
toteutuu puheessa ympäristönsä lyhyeen vokaaliin nähden pitkänä kes- 
tona, mutta geminaatassa pitkää kestoa havainnoidaan esimerkiksi klu- 
siilien tapauksessa lähinnä sulkeumavaiheen eli hiljaisen jakson kautta. 
Suomi toisena kielenä -oppijan aikaisemmin oppimissa kielissä kesto- 
erolla ei välttämättä ole lainkaan merkitystä erottavaa tehtävää tai kesto- 
ero voi olla distinktiivinen vain joissakin äänteissä. On siis huomatta- 
va, että esimerkiksi juuri äännekestojen kirjoittamisen vaikeudet eivät 
liity ainoastaan kirjoitetun kielen normien hallinnan puutteisiin vaan 
myös kielenhallintaan. Vasta, kun oppija oppii kuulemaan esimerkiksi 
suomen kielen merkitysten rakentamisen kannalta keskeiset kestoerot, 
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hän voi oppia myös tuottamaan näitä eroja puheessa ja kirjoituksessa 
tarkasti. 

Piper (2001, 23) kritisoi lapsuusiän toisen kielen oppimista käsitte- 
levässä teoksessaan opettajia virhepoliiseina toimimisesta eli siitä, että 
virheet nähdään koulussa epäonnistumisen merkkinä. Nykyisen oppi- 
miskäsityksen mukaan virheet ovat kuitenkin oppimisen edellytys ja 
osoitus käynnissä olevasta oppimisprosessista eli ikään kuin osittaisesta 
menestyksestä uuden asian käyttöön siirryttäessä (esimerkiksi Martin 
2009, 324). Kun aktiivinen kielenoppija testaa osaamistaan ja kielestä 
tekemiään päätelmiä, virheiltä ei voi eikä tarvitse välttyä. Virheet voivat 
olla myös osoitus jo jollain tavalla omaksutun asian uudelleen proses- 
soinnista, sillä ”takapakki ja uudelleen analysoiminen” ovat oppijankie- 
lelle tyypillisiä piirteitä, kuten Martin (2003, 83) asian ilmaisee. 

Kielitaidon eri osa-alueisiin pureutuvan tutkimuksen perusteella ra- 
kennetun CAF-mallin mukaan kielitaito kehittyy koko ajan rinnakkain 
kolmella osa-alueella: samalla, kun opitaan tuottamaan uusia, komplek- 
sisempia muotoja, jo haltuun otettujen muotojen tuottaminen käy suju- 
vammaksi ja tarkemmaksi (ks. esimerkiksi Housen & Kuiken 2009; 
Housen, Kuiken & Vedder 2012). Keskittyminen yhteen osa-alueeseen 
tyypillisesti kuitenkin heikentää muita ainakin väliaikaisesti, ja esimer- 
kiksi kirjoitusnopeuden kasvattamisesta seuraa helposti sekä käytetyn 
sanaston ja rakenteiden yksinkertaistuminen että pulmia ilmaisun 
tarkkuudessa. Kouluiässä kirjoittaminen kehittyy monialaisesti, mikä 
omassa tutkimusaineistossani näkyy muun muassa tuottamisen runsas- 
tumisena sekä harvinaisten ja rakenteeltaan kompleksisten sanojen käy- 
tön tihentymisenä vuosiluokalta toiselle siirryttäessä samaan aikaan, 
kun ilmaisu tarkentuu ja tekstien kokonaisrakenne kehittyy (Honko 
2013). Kielen sujuvuus, tarkkuus ja kompleksisuus eivät kuitenkaan 
etene samaan tahtiin tai suoraviivaisesti, ja osa kielelliseen ilmaisuun 
yhtä aikaa vaikuttavista tekijöistä voi olla vaikutuksiltaan vastakkaisia.” 
Yksi esimerkki on sanapituuden ja tarkkuuden suhde. Yleinen kielen 


77 Suomi toisena kielenä -oppijoiden kirjoittamistaitojen kehittymistä taitotasoittain on tutkittu mm. 
Cefling- ja Topling-hankkeissa Jyväskylän yliopistossa, ks. esimerkiksi Seilonen 2013, Mustonen 
2015 ja Lesonen 2020, ensikielisten peruskouluikäisten kirjoitustaitoja puolestaan Myöhemmän 
kielenkehityksen hankkeessa (ks. Pajunen 2012). 
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kehittymisen tendenssi on, että oppimisen myötä ilmaisupituus kasvaa 
ja tarkkuus lisääntyy. Tämän tutkimuksen kertomusaineistossa tarkim- 
pia ovat keskimäärin kuitenkin tekstit, joissa suhteellinen sanapituus on 
pieni Ristiriitaa selittäviä tekijöitä on monia: 1) Ensinnäkin lyhyet sa- 
nat ovat tyypillisesti kielen yleisimpiä ja tutuimpia sanoja, joiden kirjoi- 
tusasu hallitaan muita sanoja paremmin. 2) Tekstit, joissa keskimääräi- 
nen sanapituus on pieni, yleensä myös rakentuvat suhteellisen pienen 
sanamäärän varaan, jolloin hallittavien sanojen ja sananmuotojen määrä 
pysyy kohtuullisena. 3) Sanastoltaan monimuotoisissa teksteissä taas 
tarvitaan yleisten lisäksi harvinaisia sanoja. Harvinaisten sanojen käy- 
tön myötä sanapituus väistämättä kasvaa, mutta myös virheiden toden- 
näköisyys lisääntyy.?? (Ks. tarkemmin Malvern ja muut 2004, 173.) 4) 
Oppimisen alkuvaiheessa kirjoittamisen lyhytsanaisuus yhdistyy usein 
suffiksaation eli esimerkiksi sanojen taivuttamisen vähäisyyteen. Oppi- 
misen edetessä kielen yleisimmät sanat ja tutut sanamuodot osataan jo 
hyvin, mutta etenkin harvinaiset sanat sekä sanojen yhdistyminen ja 
kontekstissaan oikean muodon valinta voivat aiheuttaa haasteita pitkään. 


Tarkkuuden mittaaminen 


Tarkkuuden mittaaminen edellyttää mittayksikköä, jonka kautta osaa- 
mista ja sen kehitystä tarkastellaan, ja valintaa yksikön esiintymien ar- 
vioinnissa. Määrittelen tässä luvussa oman lähestymistapani ja esittelen 
samalla tutkimuksen aineiston. 


MIKÄ ON VIRHE? 
Se, mitä kielessä pidetään virheellisenä, on aina sopimuksenvaraista ja 
ajassa muuttuvaa. Sekä maallikot että kielen ammattilaiset voivat arvioi- 


78 Lisäksi aikuismaisesta kirjoittamisesta poiketen tekstien rakenteellinen kompleksisuus yhdistyy 
alaluokilla keskimääräistä pienempään sanapituuteen, mitä mahdollisesti selittää tekstin tuottamisen 
kuormittavuus (Honko 2013, 339). 

79 Pitkät sanat tarjoavat suuremman grafeemimäärän vuoksi suhteessa enemmän mahdollisuuksia 
virheisiin kuin lyhyet. Toisaalta sanan pituus ei automaattisesti tee siitä vaikeaa, mihin vaikuttaa 
suomen kielessä etenkin pitkien sanojen monimorfeemisuus. 
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da kieltä eri tavoin: toinen pitää virheellisenä (inaccurate) ilmausta, 
joka toisen mukaan on aivan kelvollinen (acceptable) tai korkeintaan 
kontekstissaan sopimaton (inacceptable). Virheet, jotka viestin yhdessä 
vastaanottajassa saavat aikaan negatiivisia tunnereaktioita, eivät vaikuta 
samalla tavalla kaikkiin saman viestin tulkitsijoihin. (Ks. esimerkiksi 
Pääkkönen 1985; James 1998; Boland & Queen 2015, 2016; Al-Mahroogi 
& Al-Aghbari 2016). Äidinkieleltään muunkielinen esimerkiksi saattaa 
arvioida oppijankieltä sekä tarkkuuden että pragmaattisen sopivuuden 
suhteen jopa korkeasti kouluttautunutta äidinkielistä puhujaa kriitti- 
semmin (Al-Mahrooqi & Al-Aghbari 2016, 7). 

Kirjoitetun suomen kielen tarkkuuden tarkastelun tekee erityisen vai- 
keaksi virheiden ongelmallinen luokittelu. Puutteet oikeinkirjoituksessa, 
morfologian hallinnassa ja sanojen sekä sanontojen merkitysten osaami- 
sessa limittyvät toisinaan niin, että virheiden analysointi tarkkarajaisesti 
voi olla mahdotonta (ks. myös Tarnanen 2002, 127-128). Vaikka toi- 
sen ja vieraan kielen tutkimuksessa systemaattiset virheet (errors) sekä 
satunnaiset lipsut (mistakes) on usein pyritty erottamaan toisistaan 30 
ei tällainen eronteko kuitenkaan ole mahdollista analysoitaessa lyhyitä 
tekstinäytteitä, esimerkiksi tämän tutkimuksen aineistoa. En myöskään 
erottele kontekstiriippuvaisia ja kontekstista riippumattomia virheitä 
— eli esimerkiksi rektiosijojen väärin valittuja sijamuotoja (me emme pi- 
dän) väärin muodostetuista (me emme pidän sinästä). 

James (1998, 64-78) erittelee kielellisten ilmausten tarkkuutta paitsi 
ilmausten laadun myös niiden hallinnan asteittaisen kehittymisen kaut- 
ta. Toisessa ääripäässä ilmausta ei osata vielä lainkaan, toisessa ääripääs- 
sä sitä käytetään aina oikein. Tyypillisen ja epätyypillisen kielenkäytön 
erottavan linjan sen enempää kuin säännönmukaisuuden rajapyykkien 
asettelu ei kuitenkaan ole yksiselitteistä. Tyylipoikkeamia, esimerkiksi 
puhekielen muotojen soveltamista kirjoitukseen, en ole omassa tutki- 
muksessani katsonut perustelluksi tulkita virheiksi lainkaan, sillä kir- 
joittajat vasta opettelevat kielen eri rekisterien konventioita. Lisäksi ker- 
tomusgenre jo itsessään mahdollistaa puhekielen käytön esimerkiksi 


80 Perusteena on pidetty mm. sitä, että lipsahdukset eivät noudata systematiikkaa, joka voitaisiin 
järkevällä tavalla kuvata (ks. Corder 1967, 166-167). 
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henkilöhahmojen dialogeissa. Näyttää tosin siltä, että alakouluikäisten 
kertomustekstien dialogit ovat ennemmin hypernormatiivisia ja noudat- 
tavat liian orjallisesti kirjoitetun kielen konventioita kuin ottavat vapauk- 
sia puhekielisyyden suuntaan, mikä muistuttaa Tannerin (2012) havain- 
toja oppikirjatekstien dialogeista. 

Kirjoittamisen tarkkuutta mitattaessa on päädytty kolmenlaisiin me- 
nettelytapoihin (ks. esimerkiksi Ellis & Barkhuizen 2005). Holistinen 
arvio tekstin virheettömyydestä on taloudellinen tapa saada tarkkuudesta 
yleiskäsitys. Se ei kuitenkaan anna lainkaan konkreettista tietoa kielelli- 
sen tuen tarpeesta eikä kerro sitä, kuinka laaja-alaisia pulmia kielen 
tarkkuudessa on. Jotkin virhetyypit, esimerkiksi sanojen sekoittuminen, 
saattavat myös painottua holistisessa arvioinnissa muita enemmän. 
Tämä ei kuitenkaan näy arviointituloksesta, joka on yleensä karkean 
mitta-asteikon mukainen numeerinen tai sanallinen arvio tarkkuuden 
tasosta. Arvioinnissa voidaan myös keskittyä tietyn piirteen tai tiettyjen 
piirteiden tarkkuuteen, jolloin saadaan tietoa juuri haluttujen kielenpiir- 
teiden hallinnasta. Toisaalta valitut piirteet voivat edustaa hyvin suppeaa 
osaa oppilaan kieliopin tai sanaston hallinnasta puhumattakaan koko- 
naiskielitaidosta. Kolmas vaihtoehto tarkkuuden mittaamiseen on las- 
kea virhetiheys eksplikoidulle virhejoukolle esittämällä esimerkiksi näi- 
den suhteen virheettömien sanojen tai lauseiden tai virkkeenkaltaisten 
T-yksiköiden prosenttiosuus. Tällöin ei yleensä oteta kantaa virheiden 
kokonaismäärään eikä virheiden laatua välttämättä eritellä tulosten esit- 
telyn yhteydessä. 

Yhdistämällä eri arviointitapoja, kuten tässä tutkimuksessa teen, on 
mahdollista verrata tarkkuutta erilaajuisissa aineistoissa ja pureutua tar- 
kemmin muun muassa siihen, mihin muihin kielen osatekijöihin tark- 
kuus on yksilötasolla yhteydessä. Eri virhetyyppien jakauma voi toimia 
lähtökohtana toistuvien virhetyyppien tarkemmalle laadulliselle ana- 
lyysille. Vastaavasti yksittäisten kielenpiirteiden tarkkuutta seuraamal- 
la voidaan saada tietoa paitsi sen tyypillisestä vakiintumisajankohdasta 
oppijankieleen myös mahdollisista välivaiheista ja myöhemmistä uudel- 
leenjärjestelyistä sekä tuen tarpeista silloin, kun tarkentumista ei tapah- 
du odotetulla tavalla. 
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Suomessa oppijankielen tarkkuutta on alimmilta vuosiluokilta lahtien 
perinteisesti havainnoitu sanelukirjoittamisen yhteydessä joko laskemal- 
la oppijan tuottama virhemäärä tai virheettömien tekstisanojen määrä. 
Tilalle Kulju ja Mäkinen (2009, 511) ovat ehdottaneet sanan fonologisen 
kokonaisrakenteen hallinnan arvioimista. Diagnosoinnin välineenä on 
käytetty myös erilaisia sanelukirjoituksen sovelluksia sekä muita struk- 
turoituja testejä, kuten virheiden paikantamiseen ja epäsanoihin liittyviä 
tehtäviä. Näiden suositeltavuus on sidoksissa paitsi itse testien ominais- 
laatuun ja käyttötarkoitukseen myös koulukäynnin vaiheeseen ja testat- 
tavan ryhmän erityispiirteisiin (ks. esimerkiksi Santala, Saaristo-Rinta, 
Metsola & Klippi 2013). Tämän tutkimuksen verrokkikorpukseen perus- 
tuvassa tutkimuksessa Lehtinen (2013) erittelee S1-kirjoittajien tekstien 
tarkkuutta toisella, neljännellä ja kuudennella vuosiluokalla kirjoitetuis- 
sa Unelmakirjoitelmissa. Lehtinen ei kuitenkaan käsittele tekstien vir- 
hetiheyttä suhteessa tekstien muihin ominaisuuksiin tai kirjoittamisen 
tarkkuutta yksilötason kielitaidon osa-alueena. Alakouluikäisten S2-op- 
pijoiden teksteistä kattavaa tarkkuuden analyysiä ei tietääkseni ole tehty. 
Tässä luvussa havainnoidaan kirjoittamisen tarkkuutta monikielisessä 
lapsijoukossa sekä määrällisen että laadullisen analyysin avulla. 


AINEISTO JA ANALYYSIMETODI 

Tutkimusaineistoni koostuu yhteensä noin Goo kertomustekstista,® 
joista osa on suomea äidinkielenä puhuvien koululaisten ja osa edisty- 
neiden,* lukuisia eri kieli- ja kulttuuriryhmiä edustavien suomi toisena 
kielenä -oppijoiden (S2) kirjoittamia (ks. myös Honko 2013). Kaikki kir- 
joittajat ovat yleisopetuksen oppilaita. Kertomuskeruun yhteydessä oppi- 
joille painotettiin, että tekstin tuottamisessa sisältö on tärkein, mutta 
kehotettiin silti pyrkimään kirjoitetun kielen sääntöjen noudattamiseen 
ja tarkistamaan teksti kirjoittamisen lopuksi. Tekstit kirjoitettiin käsin 
ja syötettiin myöhemmin Excel-tietokannaksi. 


81 Tekstit on kirjoitettu yhtenäisellä teemalla Unelmien päivä. 

82 Kaikki tutkimukseen osallistuneet suomi toisena kielenä -oppilaat ovat Suomessa syntyneitä tai ennen 
esikouluikää Suomeen muuttaneiden maahanmuuttajavanhempien lapsia, jotka ovat tutkimuksen 
alkuvaiheessa asuneet Suomessa vähintään neljä vuotta ja sen loppuvaiheessa vähintään seitsemän 
vuotta (Honko 2013). 
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Tarkkuuden analysoinnissa keskityn kuuteen kirjoittamisen ongelma- 
kohtaan (ks. myös taulukko 44): 

1) pulmat äänteiden merkitsemisessä 

2) sanojen yhteen ja erilleen kirjoittamisen virheet 

3) taivutusvirheet (myös puuttuva taivutus ja virheellinen sanavartalo) 

4) sanajärjestyksen virheet 

5) virheellinen sanavalinta, taivuttamaton tai puuttuva sana 

6) muu lause- tai virkerakenteen ongelma 


Tarkkuuden analysoinnin taustaksi olen seurannut sekä suomea ensim- 
mäisenä (S1) että toisena kielenä (S2) puhuvien lasten kielitaidon muu- 
toksia myös muilla kirjoittamisen osa-alueilla, kuten kirjoittamisen suju- 
vuuspiirteissä ja käytetyssä sanastossa. Lisäksi olen kerännyt opettajilta 
tietoa lasten kokonaiskielitaidosta ja kielellisistä erityisvaikeuksista (ks. 
Honko 2013). Laadullisen virheanalyysin jälkeen vertaan kirjoittamisen 
tarkkuutta muihin kirjoittamisen osataitoihin tilastollisten analyysien 
avulla. S2-ryhmässä vertaan lasten yksilöllisiä kirjoittamistaitoja myös 
heidän kokonaiskielitaitoonsa käytettävissä olevan kyselytiedon avulla. 
Kyselytieto koostuu erillisestä suomen kielen sanaston hallintaan painot- 
tuvasta kielitestistä, S2-arvosanasta sekä lomakevastauksista, joissa 
suomen kielen ja oman äidinkielen opettajat arvioivat lapsen kielitaitoa 
kielitaidon eri osa-alueilla sekä mahdollisia kielellisiä erityisvaikeuksia. 
Olen käyttänyt määrällisissä analyyseissa lähinnä ei-parametrisia tilastol- 
lisia analyysejä, sillä ne soveltuvat aineistoni laatuun parametrisia testejä 
paremmin. Lisäksi olen tutkinut aineistoa sirontakuvioiden avulla mah- 
dollisten epälineaaristen yhteyksien paljastamiseksi. 

On syytä huomata, että vaikka kirjoittamisen tarkkuutta tarkastellaan 
käyttöpohjaisesti, virheiden syntymisen täsmällisiin syihin ei tässä tutki- 
muksessa päästä käsiksi. Esimerkiksi äännevirheet voivat olla seurausta 
foneettisen tietoisuuden puutteista (väärin kuultu sanahahmo), sana- 
hahmon väärästä muistiedustuksesta (oikein kuultu sana muistetaan 
väärin) tai kirjoitusjärjestelmän hallintaan liittyvän dekoodauksen ongel- 
mista (oikein muistettua sanaa ei vielä osata kirjoittaa oikein). Myös 
virheiden luokittelussa on toisinaan monitulkintaisuutta. Epävarmoissa 
tapauksissa olen katsonut ilmauksen mieluummin mahtuvan suomen 
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kielen variaation piiriin kuin poikkeavan siitä. Kun kirjoitettu muoto 
esimerkiksi reaalistuu partitiivia vaativassa lauseasemassa sanakirja- 
muodon kaltaisena taivuttamattomana sanana (jalkapallo), ei voida var- 
muudella sanoa, että kirjoittaja olisi pyrkinyt taivutusmorfologian käyt- 
töön. Tapaukset on silti koodattu ainoastaan äännekestovirheenä, koska 
vokaaliyhtymän assimiloituminen (kuten jalkapalloa — jalkapalloo) on 
puhekielelle tyypillinen piirre ja koska puhekielisyys muutoinkin voi- 
makkaasti näkyy alakoululaisten kirjoittamisessa muun muassa juuri 
assimilaatioilmiöinä sekä loppukonsonanttien katona. Kielenhallinnan 
ja kirjoittamisen puutteet voivat toisin sanoen kirjoituksessa langeta yh- 
teen, jolloin niitä ei voida luotettavasti erottaa yksittäisistä teksteistä. 

Olen analysoinut tekstit yhdistetystä tekstikorpuksesta, jossa eri viite- 
ryhmien oppijoiden tekstit esiintyvät sekoitettuna. Analyysiä on ohjan- 
nut käyttöpohjaisuus, eli olen systemaattisesti ottanut huomioon myös 
poikkeavien muotojen esiintymiskontekstin. Tällainen lähestymistapa on 
oppijankielen tarkastelussa välttämätön, sillä vaikkapa urheiluselostus- 
ta jäljittelevä kielenkäyttö huudahduksissa siiisääään! sisään" ja maaliiii! 
*maalf ei tietenkään ole osoitus kielen hallinnan puutteesta eivätkä yli- 
pitkät vokaalit perusteltavissa kirjoituksen virheiksi. 

Koska on selvää, että pelkkä virheiden lukumäärä ei eripituisia tekste- 
jä tarkasteltaessa kerro kirjoittamisen tarkkuudesta koko totuutta, olen 
laskenut virheiden tekstitiheyden suhteessa kunkin tekstin kokonais- 
sanemäärään ja osin myös suhteessa kyseisen kielenpiirteen kokonais- 
määrään aineistossa. Teknisesti koodaus on toteutettu niin, että olen 
voinut tarkastella aineistosta sekä virheellisten tekstisanojen karkeaa 
määrää (ottamatta kantaa virhetyyppiin tai eri virheiden mahdolliseen 
limittymiseen saneessa) että virheiden tarkempaa laatua ja kasautumista 
yksittäisiin tekstisanoihin. Virheiden tekstitiheyksiä olen sitten analysoi- 
nut sekä kirjoittaja- että kirjoittajaryhmäkohtaisesti. 

Usein toistuvista virheistä välimerkkivirheitä ei tutkimuksessa ole 
koodattu virheiksi, eikä välimerkkien norminmukaista käyttöä voi vielä 
alaluokilla pitää odotuksenmukaisenakaan.% Yksilölliset erot välimerk- 


83 Ks. virheanalyysista oppijankielen tutkimuksen yhteydessä esimerkiksi Gass & Selinker 1994, 66—74. 
84 Koska sidossanojen käyttö on alaluokilla vielä melko vähäistä ja yksipuolista, voitaisiin useat 
virkerajamerkinnät korjata myös sidossanojen avulla. 
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kien käytössä ovat valtavan suuria, sillä vaikka jo tois- ja kolmasluok- 
kalaisissa on kirjoittajia, joille välimerkkien käyttö on sekä onnistunut 
virheettömästi että ollut monipuolista, eivät kaikki kirjoittajat ole käyttä- 
neet välimerkkejä lainkaan tai niiden käyttö on yhä ollut horjuvaa ja tie- 
tämys esimerkiksi välimerkin sijainnista puutteellinen (ks. esimerkki 1). 


1) Olipakeran toive päivä. Aamulla minulle tuotiin sänkyyn. Lahjan 
kun avasin sen sieälä oli. uusi pallo sen jälkeen me mentiin. uimaan 
serenaan sielä oli. Vesiliukumäkiä ja kun me. Tultiin sieältä me läh- 
dettiin Lasketelemaan minä otin mukaan, Oman lumi laudan sieälä 
oli. Hiihto hissejä siten me lähdetiin. pois ja mentiin linanmäelle, me 
mentiin vuoristorataan, ja kahvikupeihin ja peisotiin. ja karuselliin 
siten. sen jälkeen me lähdettiin. Vuokraamaan lefaa ja pidetiin lefa ilta 
ja mentiin vasta. Kahelta yällä nukumaan. minä vielä valvoin vähän 
aikaa ja nukahdin. Loppu. (3. lk. PS1) 


Ylemmillä vuosiluokilla päättövälimerkkien käyttäminen sujuu jo melko 
hyvin, mutta sivulausepilkutuksen ja erikoismerkkien käytössä on yhä 
hyvin suuria yksilöiden välisiä eroja — kuten on välimerkit mahdollis- 
tavien rakenteiden käytössäkin. Runsaat välimerkkivirheet voivat siis 
olla merkki paitsi tarkkuuden ongelmista myös edistyneestä lause- ja 
virkerakenteiden käytöstä. 


Tarkkuus alakoululaisten kertomusteksteissä 


Alakouluikäisten kirjoittaminen on kehittyvää ja tuottaa monenlaista tar- 
kasteltavaa. Sanastossa ja rakenteissa on puhekielisyyttä ja ilmaukset voi- 
vat olla monitulkintaisia ja hankalasti ymmärrettäviä. Keskityn tässä yh- 
teydessä tarkemmin sanatason ongelmiin, lähinnä normipoikkeamiin, 
ja tyypittelen niitä tiheyden, kirjoittajaryhmien ja toistuvuuden kannalta. 
Muita, esimerkiksi tyyliin liittyviä ongelmia enemmän esittelen taus- 
taksi kuin analysoin virheiksi. Kertomusrakenne ei ole suurella osalla 
nuorimmista alakoululaisista vielä hallinnassa, samoin lause- ja virke- 
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rakenne voi ikätasolla tuottaa ongelmia, joten tarkastelen rakenneseik- 
koja tarkemmin vain vanhempien alakoululaisten kirjoitelmista. 


PUHEKIELI OSANA KERTOMUSTEKSTEJÄ 

Kertomustekstien poikkeamat kirjoitetusta yleiskielestä voidaan jakaa 
karkeasti kahteen pääluokkaan: normi- ja tyylipoikkeamiin. Normipoik- 
keamilla tarkoitetaan muotoja, jotka eivät kuulu pysyvänä osana mi- 
hinkään kohdekielen tunnettuun varianttiin vaan esimerkiksi syntyvät 
tilanteisina lipsahduksina tai ovat osoitus keskeneräisestä oppimispro- 
sessista (esimerkit 2 ja 4). Tyylipoikkeamat puolestaan syntyvät kielen 
varianttien sekoittumisesta. Kirjoitetussa kielessä normipoikkeamia 
edustavat selkeimmin oikeinkirjoitusvirheet sekä virheet sanojen sijatai- 
vutuksessa ja vartalomuutoksissa, tyylipoikkeamia esimerkiksi varieteet- 
tien sekoittumisesta johtuvat leksikaaliset erikoisuudet, kuten leimalli- 
sesti puhekieliset ja lapsenkieleen kuuluvat sanat tai sananmuodot.5 
Etenkin nuorten koululaisten tekstejä arvioitaessa on usein olennaista 
erottaa puhekielisyydet (ks. esimerkit 2-3) muista poikkeamista, sillä 
vaikka lapset jo alaluokilla oppivat, että kielellä on useita ilmenemis- 
muotoja, he eivät välttämättä pysty pitämään variantteja johdonmukai- 
sesti erillään. Sen sijaan esimerkiksi sanan grafeemirakenteen virheet 
johtuvat yleensä sanahahmon vieraudesta tai foneemisen rakenteen de- 
koodauksen ongelmista. 


2) Me juhlitaan [vrt. *me juhlivat] ihanassa ravintolassa koko perhe. 
3) Monet ihmetteli, että miks mulla on kepit ”kainalosauvat'. 


R 


vrt. virhemuodot *ihmetelli, *etta, *mulle on, *tikkut 


Alakoululaisten teksteissä puhekielisyys värittää kielen rakennetta ja 
näkyy myös sanavalinnoissa, vaikka kieli saattaa muutoin olla lähes 
virheetöntä. Puhekielisyyksien esiintyminen kertomusteksteissä on 
runsaimmillaan aivan kirjoitustaipaleen alussa mutta vähenee selvästi 
jo kolmannelle vuosiluokalle tultaessa. Salosen (2012) tutkimus tosin 
osoittaa, että kehitys ei ole lineaarista vaan tarkentuvan, kirjoitetun yleis- 


85 Puhekielen muotoja en tässä yhteydessä ole sisällyttänyt virheanalyysiin. 
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kielen piirteitä tunnollisesti noudattavan vaiheen jälkeen puhekielisyys 
uudelleen lisääntyy ja myös muuttaa muotoaan. Pojilla puhekielisyydet 
ovat alakoululaisten aineistossa hiukan yleisempiä kuin tytöillä ja S2-kir- 
joittajien teksteissä selvästi yleisempiä kuin Sr-kirjoittajien teksteissä. 
Tässä suhteessa myös toisen ja vieraan kielen opiskelijoiden tekstit 
poikkeavat toisistaan, sillä vieraskielisessä ympäristössä kieltä opitaan 
tiiviimmin kirjoitetun kielenmuodon välittämänä ja oppijan arkiseksi 
pulmaksi voi muodostua ennemmin puhekielen varianttien puute kuin 
niiden ylikäyttö. Kielen eri rekisterien haltuun ottamisen myötä puhe- 
kielisyys muuttuu vähitellen yhä selvemmin tietoisesti käytetyksi tyyli- 
keinoksi, jolla muun muassa elävöitetään dialogeja, puhutellaan lukijaa 
ja joskus jopa protestoidaan kirjoittamisen konventioita vastaan (ks. 
myös Halonen 2009 ja Niinimäki tässä teoksessa). Silti kielen variant- 
tien vaihtelu on alakouluikäisten teksteissä usein vielä hallitsematonta. 


KERTOMUSTEKSTIEN YMMÄRRETTÄVYYS 

Kertova teksti on todettu kouluikäisille suhteellisen helpoksi tekstilajik- 
si; vähäisilläkin taidoilla onnistuminen on mahdollista, vaikka kirjoitta- 
minen iän ja karttuvan kokemuksen myötä kehittyy ja esimerkiksi ar- 
vioiva, analysoiva ote yleistyy (ks. esimerkiksi Pajunen 2012). Tekstien 
päätehtävä eli kommunikatiivisuus täyttyy unelmapäiväteksteissäkin jo 
alaluokilla hyvin, sillä koko aineistossa ainoastaan muutaman yksittäi- 
sen tekstikohdan tulkinta jää epävarmaksi (esimerkiksi tardo ’automerk- 
ki').86 Tekstien tulkitseminen edellyttää silti lukijalta maailmantietoa ja 
toisinaan myös kielellistä soveltamiskykyä. Tätä havainnollistaa seuraava 
kuudesluokkalaisen tytön kertomuskatkelma (ks. esimerkki 4), jossa 
limittyvät puhekielen redusoituneet muodot sekä taivutusmuotojen va- 
linnan ja sanahahmon tarkkuuden pulmat: 


4) Ja unelmoin että kukaa meistä perheestä tai joku muu ei tarvii 


olla jokin asma tai syöpä tai kaikki nämä jutut. (6. Ik. TS2, albania, 
12 vuotta Suomessa) 


86 Koko 60000 saneen aineistossa epäselviä lekseemejä on vain kymmenkunta. 
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Toisinaan tulkinnanvaraisuuksissa on kyse laaja-alaisesta rakenteen tai 
tekstin jäsentelyn epäselvyydestä, mutta joskus myös yksittäisen leksi- 
kaalisen valinnan tulkinta aiheuttaa lukijalle päänvaivaa (esimerkiksi 
Huoisin leikkiä ”haluaisin'/'voisin'). Koheesion ja virketasoa laajemman 
kokonaisrakenteen pulmat on jätetty tarkkuusanalyysin ulkopuolelle. 
Tämäntyyppiset rakenteen pulmat vaikuttavat kuitenkin välillisesti ker- 
tomusrakenteen holistiseen arvioon, jota olen käyttänyt virhetiheyden 
vertailumuuttujana. 

Joissakin virheellisen muodon sisältävissä tekstikohdissa tavoitemuo- 
don tulkinta jää epävarmaksi. Esimerkissä 5 rakennevirheen taustalla 
saattaa olla taivutusmorfologian puutteellinen hallinta mutta myös ti- 
lanteeseen epäsopivat leksikaaliset valinnat: 


5) Ja kato Big ben, juuri avatessa ikkunan verhot ja kivat naapurit. 
(6. lk. PS2, vietnam) 


Esimerkin 5 tulkinnaksi sopisi ja näin Big Benin heti, kun avasin ikku- 
naverhot' (Big Ben uutena puheenaiheena), mutta myös tulkinnat ’kat- 
soin Big Beniä’ tai 'ja katso’ tai ja kuvittele’ olisivat mahdollisia. Esi- 
merkissä 6 puolestaan subjektin tai subjektina toimivan nominilausek- 
keen merkitsemättä jättäminen on koheesion kannalta ongelmallista: 
Mikä on se, joka jatkui? 


6) Olin voittanut lotossa illalla urheiluauton ja veneen. Ja ei kuin vain 
jatkunut kun minä sain viestin, jossa luki ettei minun tarvitse enää 
koskaan käydä koulussa. (6. lk. PS1) 


Lauseiden ketjuttaminen on jo alaluokilla tyylillisesti ominaista muuta- 
mille taitavillekin kirjoittajille. Rakenteellisen ongelman ketjuttaminen 
muodostaa esimerkiksi silloin, kun lukijan odottama päälause jää virk- 
keestä puuttumaan ja semanttinen sisältö karkaa (ks. esimerkki 7): 


87 Merkityslaajentumista lapsenkielessä ks. esimerkiksi Tomasello & Akhtar 2000, 184. 
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7) Kun meillä oli niin paljon rahaa ettemme voineet enää kantaa sitä 
mukana koska emme halunneet, että sitä valtavaa rahamäärää jonka 
voitimme, emme halunneet, että niitä varastetaan. (6. Ik. TS1) 


Alaluokilla monet tekstit ovat kuitenkin vielä sana- tai lausekelistoja, 
eikä lausetason rakenteellisille pulmille ole ollut luontevaa osoittaa mää- 
rää tai aina edes hahmoa (poikkeuksena jo mainitut erikseen koodatut 
virhetyypit). Siksi rakennevirheet on tässä tutkimusaineistossa koodattu 
ainoastaan viides- ja kuudesluokkalaisten kertomuksiin. Koska virke- 
rakenteen puutteet yhdistyvät alaluokilla voimakkaasti muihin kielen- 
hallinnan ja kirjoittamisen ongelmiin, ne heijastuvat joka tapauksessa 
tarkkuusanalyysin tuloksiin ja kertomusrakenteen holistiseen arvioon. 


VIRHETIHEYS SEKÄ SEN MUUTOKSET RYHMÄ- JA YKSILÖTASOLLA 
Tarkkuuden yleisindikaattorina käytän virhetiheyttä, joka on laskettu 
virheiden määrän ja tekstisanojen kokonaissanemäärän suhteesta si- 
ten, että yksittäiseen saneeseen liittyvät eri virheet on huomioitu vain 
kerran. Vaikka osa virheistä todennäköisesti on seurausta kielitaidon 
kompleksistumisesta (esimerkiksi rektiovirheet uusien verbien yhteydes- 
sä) ja kirjoitussujuvuuden kasvusta (esimerkiksi lipsut oikeinkirjoituk- 
sessa), ei silti ole tarkoituksenmukaista tai oletettavaa, että epätarkkuu- 
det kielessä lisääntyisivät säännönmukaisesti tai hallitsisivat ilmaisua 
oppijoiden siirtyessä vuosiluokalta toiselle. Onkin mielenkiintoista seu- 
rata, miten oppijankielen tarkkuus muuttuu kolmen vuoden seuranta- 
jakson aikana, jolloin sekä sujuvuuspiirteissä (tuottamisrunsaus, lek- 
seemi- ja sanepituus) että sanaston kompleksisuudessa (sanarakenne, 
harvinaisten sanojen käyttö ja käytetyn sanaston vaihtelevuus) tiedetään 
tapahtuvan kehitystä (ks. myös Honko 2013). 

Suurin virhetiheys, keskimäärin noin 20 virheen sisältävää tekstisa- 
naa sataa juoksevaa tekstisanaa kohden, on alaluokilla S2-poikien teks- 


88 Tekstien tarkkuutta on L2-kontekstissa yleisesti tutkittu laskemalla virheettömien lauseiden, virkkeiden 
tai T-yksiköiden suhteellisia määriä (ks. esimerkiksi Unsworth 2008, 320). Nuorimpien kirjoittajien 
tekstiaineiston tarkkuuden tarkasteluun lause- ja virkeajattelu soveltuu huonosti ennen kaikkea siksi, 
että lause- ja virkerakenteiden laajuudessa ja kompleksisuudessa on suuria yksilöiden välisiä eroja. 
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teissä, pienin (noin kuusi sataa tekstisanaa kohden) puolestaan S1-tyt- 
töjen teksteissä (kaavio 13). S1-poikien ja S2-tyttöjen ryhmien välillä ei 
lähtötasossa ole merkittävää eroa, vaikka eri virhetyypit painottuvatkin 
ryhmissä eri tavoin. Sen sijaan kieliryhmien sisällä tyttöjen ja poikien 
kielellinen tarkkuus poikkeaa toisistaan voimakkaasti, sillä poikien 
teksteissä virheellisiä sananmuotoja tulee tekstissä vastaan lähes puolet 
useammin kuin tyttöjen teksteissä. 


25,0 


20,0 


15,0 


10,0 


Virheellistä sanaa / 
100 tekstisanaa 


5,0 


Kaavio 13. Virhetiheyden muutos alakoulun alku- ja loppuvaiheessa kirjoittaja- 
ryhmittäin 39 


Sanemäärään suhteutettu keskimääräinen virhetiheys laskee koko koulu- 
laisaineistossa jo toiselta kolmannelle vuosiluokalle lähes kolmanneksen 


89 Virhetiheys sisältää äänteiden merkitsemiseen ja äännevaihteluihin liittyvät virheet, yhteen ja erilleen 
kirjoittamisen virheet, taivutusvirheet (myös puuttuva taivutus), selkeät sanajärjestysvirheet ja sellaiset 
selkeät lausetason rakenteelliset virheet, joita ei voisi korjata välimerkein. Virhetiheys ei sisällä puhe- 
kielisyyksiä tai alkukirjain- ja välimerkkivirheitä. 


324 MARI HONKO 


https://doi.org/10.21435/skst.1472 


eli kahdestatoista noin kahdeksaan virheelliseen sanaan sataa juoksevaa 
tekstisanaa kohti. Ylemmillä vuosiluokilla virhetiheys on keskimäärin 
enää alle puolet alkuperäisestä eli noin viisi virheellistä tekstisanaa sataa 
juoksevaa sanaa kohti. Käytetyllä mittarilla arvioituna kirjoittaminen on 
viidennellä luokalla siis jo hyvinkin tarkkaa. Viidennen ja kuudennen 
vuosiluokan välillä virhetiheys ei kuitenkaan enää laske, eikä virhetyyp- 
pien keskinäisissä suhteissa tapahdu merkittävää muutosta. 
Virhetiheyden muutos on selkeä kaikissa kirjoittajaryhmissä. Eni- 
ten kirjoittaminen on kolmen vuoden aikana tarkentunut S2-poikien 
ryhmässä, jossa lähtötaso oli heikoin. Kun vielä alaluokilla keskimäärin 
viidennes kaikista tekstisanoista sisälsi tässä ryhmässä yhden tai useam- 
man virheen, on virhetiheys ylemmillä luokilla yli puolet pienempi. 
Absoluuttinen virheiden määrä on vähentynyt vielä enemmän, kun 
yksittäisiin saneisiin ei enää sisälly yhtä usein monia virheitä. Kaiken 
kaikkiaan virheellisten sanojen tekstitiheys on silti S2-oppijoilla vie- 
lä alakoulun loppuvaiheessa S1-oppijoita suurempi (Wilcoxonin testi 
W = 3718.5, p<0,001) ja pojilla suurempi kuin tytöillä (W = 8161, p<o,01). 
Tuloksen tulkinnassa olennaista on muistaa, että lähes kaikki kir- 
joittajat ovat tutkimuksen ensimmäisessä vaiheessa vielä aloittelevia 
kirjoittajia, jolloin on luonnollista ja oletettavaa, että kirjoittamisen 
tarkkuudessa on paljon horjuntaa. Vaikka heikkojen kirjoittajien on pe- 
rinteisesti havaittu poikkeavan vahvoista juuri suuremman virhemäärän 
perusteella, virheiden tiedetään myös kasautuvan tietyntyyppisiin teksti- 
ympäristöihin, esimerkiksi ylipitkiin tavuihin ja sanavartaloihin pääte- 
aineksen sijaan (Kulju & Mäkinen 2009, 510-512, 522). Sekä aineis- 
toni laadullinen että määrällinen tarkastelu tukevat näitä havaintoja: 
edistyneiden alakouluikäisten teksteissä tavurakenteen karkeat virheet 
(kuten puuttuva, ylimääräinen tai tunnistamaton tavu) ovat vapaassa 
tuottamisessa kaikissa sana-asemissa ensinnäkin hyvin harvinaisia. 
Lisäksi sana-asemalla ja sanan kokonaisrakenteella on merkitystä eten- 
kin äänteiden kestoon liittyvien virheiden syntymiseen: painottomassa 
asemassa epätarkkuudet ovat yleisempiä. Hajontakuvio (kaavio 14) puo- 


90 Tutkimuksesta on rajattu pois dysfasia-diagnosin saaneet oppijat ja kokoaikaisessa erityisopetuksessa 
opiskelevat oppijat molemmista kieliryhmistä. 
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lestaan kertoo, että vaikka kirjoittajaryhmien väliset erot tarkkuudessa 
ovat suuret, jokaisessa kirjoittajaryhmässä on jo alaluokilla myös erittäin 
tarkkoja kirjoittajia. 
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2. Ik. PS1 
3. Ik. PS1 
5. Ik. PS1 
6. Ik. PS1 
2. Ik. TS1 


Kaavio 14. Virhetiheyden kehitys eri oppijaryhmissä (julkaistu aiemmin Honko 
2013, 153). 


Jo varhaisessa kielenkehityksessä 2,5-vuotiailla S1-oppijoilla ilmenneet 
sanarakenteen prosessoinnin vaikeudet voivat näkyä kouluiässä lukutai- 
don tasossa (ks. tarkemmin Kulju & Mäkinen 2009, 512). Kirjoittami- 
senkaan alkutaipaleella vaikeudet eivät ole satunnaisia, sillä aiemman 
tutkimuksen perusteella ne yhdistyvät muun muassa juuri hitaaseen ja 
takeltelevaan lukemiseen. Omassa tutkimuksessani kirjoittajaryhmien 
välinen järjestys kirjoittamisen tarkkuudessa säilyy samana alakoulun 
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edetessä. Näin on lähes kaikkien tarkasteltujen piirteiden hallinnassa, 
vaikka kussakin kirjoittajaryhmässä tapahtuu samaan aikaan huimaa 
kehitystä. Merkille pantavaa on, että myös yksilötasolla kirjoittamisen 
tarkkuus on 6o koululaisen seurantaryhmässä kohtalaisen stabiili omi- 
naisuus, vaikka vertailtavana on kultakin kirjoittajalta vain yksi teksti- 
pari. Spearmanin korrelaatioanalyysin tulos (r,= 0,50, p<o,001) kertoo, 
että virheettömimmin alaluokilla kirjoittaneet oppilaat ovat todennäköi- 
simmin kirjoittaneet ikäluokkaan verrattuna tarkasti myös kolme vuotta 
myöhemmin.” Havainnot vastaavat lukemisen vaikeudesta saatua tutki- 
mustietoa: vaikka yksittäisen kielenpiirteen hallinnassa saattaa tapahtua 
nopeitakin muutoksia, tekstitaitojen kokonaisvaltainen kehittyminen 
on hidas prosessi, jossa roolit suhteellisen taitavien ja heikkojen kielen- 
käyttäjien välillä ovat melko pysyviä (ks. esimerkiksi Eloranta, Närhi & 
Ahonen 2009; Undheim 2009; Stothers & Klein 2010). 

On muistettava, että kirjoittamisen tarkkuus ei aina ole merkki erin- 
omaisesta kirjoittamisesta vaan se saattaa toisen ja vieraan kielen oppi- 
misen kontekstissa yhdistyä tekstin leksikaaliseen ja rakenteelliseen 
yksinkertaisuuteen (ks. esimerkiksi Skehan 1998). Mukavuusalueelta 
kurkistelua — kuten monipuolisten sanavalintojen yhteyttä kirjoitta- 
misen tarkkuuteen — voidaan tarkastella suuntaa-antavasti yksittäisten 
tekstien eri piirteitä vertaamalla. Tähän palataan seuraavassa analyysi- 
luvussa, kun tekstien yksilöllistä virhetiheyttä verrataan muun muassa 
sanaston monimuotoisuuteen, harvinaisten sanojen osuuteen ja keski- 
määräiseen sanepituuteen. 


VIRHEETTÖMÄT TEKSTIT JA YKSILÖLLISET EROT 

Kokonaan virheettömiä kirjoitelmia on 5.-6. luokan aineistossa vajaat 
5 prosenttia kaikista kirjoitelmista (n,, = 4, n,,.= 9) tai noin 6 prosent- 
tia, mikäli alkukirjainvirheet jätetään huomioimatta. Ylemmillä vuosi- 
luokilla kaikki virheettömät tekstit löytyvät S1-kirjoittajien aineistosta. 
Vaikka kirjoittamisen tarkkuus on kehityksellinen piirre, siihen liittyy 


91 Esimerkiksi leksikaalisen diversiteetin eli sanaston monimuotoisuuden suoritustason pysyvyys on sa- 
massa aineistossa ja samoilla kirjoittajilla selvästi matalampi, vaikka sekin on tilastollisesti 
merkitsevä (rs = 0,33, p<o,01). 
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erottamattomasti sujuvuuden ja usein myös kompleksisuuden kärsi- 
minen (Housen & Kuiken 2009, 465). Alimmilla vuosiluokilla virheet- 
tömät tekstit ovatkin molemmissa kieliryhmissä sekä sana- että lause- 
rakenteiltaan yksinkertaisia ja tyypillisesti hyvin lyhyitä, monet vain 
yhden kokonaisen virkkeen mittaisia (ks. esimerkit 8-9). 


8) Minä unelmoin että minä osaisin mennä kauppaan. (2. lk. PS2, 
albania) 
9) Minä nukuin, nukuin ja nukuin (2. lk. PS1). 


Silloin, kun tekstissä esiintyy virheitä, niitä esiintyy yleensä useissa sa- 
noissa. S1-pojilla virheen sisältävien sanojen tyyppiarvot ovat yläluokilla 
1 ja 3 (maksimi 18), S2-pojilla 1, 2 ja 8 (maksimi 34), S1- ja S2-tytöillä 
4 (maksimiarvot 21 ja 36). Tyyppiarvot ja maksimiarvot eivät erilaajuisis- 
sa aineistoissa ole suoraan vertailukelpoisia, mutta ne kuvaavat silti yk- 
silöiden välisen vaihtelun suuruutta. Hajonta eri tekstien tarkkuudessa 
on erittäin suurta, sillä kun koko 5.-6. luokkien aineistossa virheen si- 
sältävien tekstisanojen esiintymistiheys on noin 5,4 sataa tekstisanaa 
kohden, on keskihajonta lähes 5,0. S2-oppijoille monivirheisyys on kui- 
tenkin tyypillisempää. 9? 

Poikien kertomuksista vain kolme on kokonaan kirjoitettu virheettö- 
mällä yleiskielellä, sillä muissa puhekielen rakenteet ja sanasto joko li- 
mittyvät kirjoitetun kielen muotoihin tai puhekielisyys hallitsee muotoja 
kauttaaltaan (esimerkki 10). Puhekielen konventioiden käyttö teksteissä 
on kuitenkin jo alaluokilla toisinaan tarkasti säädeltyä esimerkiksi niin, 
että se kattaa vain henkilöhahmojen puheenvuorot tai säilyy tyylillisesti 
eheänä minäkertojan äänessä läpi tekstin. 


10) Mä haluisin et mun elämäs ois ees yks koulupäivä jollo mua ei 
kiusattais. Ja mä toivoisin et saman päivän olis sisäliikkaa. Ja mä toi- 
voisin et saman päivän ois ruokan perunoit ja nakkikastiket. (3. lk. 
PS1, Uusimaa) 


92 Kun vähintään viisi virheen sisältävää tekstisanaa esiintyy 5. ja 6. vuosiluokalla keskimäärin puolella 
kirjoittajista, S1-ryhmässä osuus on 40 prosenttia ja S2-ryhmässä 64 prosenttia. 
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Kirjoitetun kielen konventioiden haltuun ottamisen haastavuudesta ker- 
too toisaalta se, kuinka myös hyvin taitavasti rakennetuissa teksteissä 
esiintyy epäsystemaattisesti käytettyjä puhekielen muotoja. Puhekielisyy- 
det ovat lisäksi huomattavasti yleisempiä kertomusten loppu- kuin alku- 
puoliskoilla, mikä voi kertoa kirjoittajan väsymisestä tekstin loppua koh- 
den. 

S1-tytöillä virheettömät kertomukset ovat jo alaluokilla selvästi pidem- 
piä kuin Si1-pojilla, ja myös niistä löytyy puhekielelle tyypillisiä piirtei- 
tä. Poikien tekstien tapaan puhekielisyyksiä esiintyy enemmän kerto- 
musten loppu- kuin alkupuolella. S1-tyttöjen alaryhmässä on silti sekä 
alimmilla vuosiluokilla että alakoulun päättövaiheessa suhteessa eni- 
ten sellaisia vahvoja kirjoittajia, joiden teksteissä sujuvuus, tarkkuus ja 
kompleksisuus yhdistyvät: monet tekstit ovat sekä pitkiä, sanastoltaan 
ja rakenteiltaan monipuolisia että virheettömiä, ja kielen eri rekisterien 
käyttö on hallittua. 

Sekä poikien suurempi virhetiheys että virheettömien tekstien pituus- 
ja laatuerot vahvistavat aiempien tutkimusten käsitystä poikien suurem- 
mista vaikeuksista äidinkielellään kirjoittamisessa. Kielenhallinta on 
verrokkitestinä toimineessa sanastotestissä pojilla samaa tasoa kuin 
tytöillä tai jopa korkeampi (Honko 2013), mutta poikien kirjoittaminen 
on oikeakielisyyden ja rekisterivalintojen suhteen epätarkempaa ja ra- 
kenteeltaan eheät tekstit ovat harvinaisempia. Tekstitaitotutkimuksessa 
rajaukset kuten valittu genren tai tekstin käsittelemisen kanava voivat 
vaikuttaa tuloksiin. Silti sekä kansallisten arviointien että PISA-kartoi- 
tusten kautta on nähtävissä, että sukupuolten väliset erot luku- ja kirjoi- 
tustaidossa eivät tasoitu pelkästään tarkastelukontekstia modifioimalla 
(ks. esimerkiksi Lappalainen 2011; Arffman & Nissinen 2015). 


YLEISIMMÄT VIRHETYYPIT 

Virheiden luokittelu (ks. taulukot 44-45) osoittaa, että eniten tarkkuuden 
pulmia alakoululaisten kirjoituksessa aiheuttavat sanojen yhteen ja eril- 
leen kirjoittaminen, kaksoiskonsonantit sekä isot ja pienet alkukirjaimet.” 


93 Taulukoihin 44-45 on listattu vain kummankin keruuvaiheen 22 yleisintä virhetyyppiä. Aineistoon koo- 
datuista virhetyypeistä osa on jäänyt harvalukuisuuden vuoksi taulukon ulkopuolelle. Tällaisia piirteitä 
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Käsin kirjoitettaessa tyypillisiä ovat myös kirjainten piirtämiseen liitty- 
vät haasteet. Lähes kaiken tyyppiset kirjoittamisen epätarkkuudet käyvät 
alakoulun loppuvaiheeseen tultaessa silti harvinaisemmiksi. Myös vir- 
heiden kokonaismäärä on pienempi, vaikka ylempien luokkien teksti- 
aineisto on sanamääräisesti noin kolmanneksen alempia vuosiluokkia 
suurempi. Muutaman yleisimmän virhetyypin (ylimääräinen ja puuttuva 
sanaraja, puuttuva geminaatta) osuus kaikista virheistä on kummassakin 
keruuvaiheessa suuri, mutta ylemmillä luokilla virheiden jakauma on 
tässä suhteessa hiukan tasoittunut yhdyssanavirheitä lukuun ottamatta. 
Taivutukseen ja sanavalintoihin liittyvät virheet ovat sikäli kiinnostavia, 
että vaikka nekin harvinaistuvat, niistä tulee muihin virheisiin nähden 
tyypillisempiä. Taivutuksen virheiden lisääntyminen voi liittyä siihen, 
että haltuun otetaan monimutkaisempia ilmaisukeinoja samalla, kun 
kertomuksen sisällöllinen ja rakenteellinen tasokkuus kasvaa. Havainto 
vastaa dynaamisten systeemien viitekehyksessä tehtyä suomen kielen 
oppimisen kulkua esittelevää tutkimusta (Lesonen 2020). 


Taulukko 44. Yleisimmät virhetyypit kertomusteksteissä 2.—3. luokalla.% 


Virhetyyppi f % Kumulatiivinen 
tiheys / 100 sanaa 


1 — Ylimääräinen sananraja 523 19,9 2,0 
2 — Puuttuva geminaatta 373 14,2 3,4 
3 — Puuttuva sananraja 346 13,1 4,8 
4 — Alkukirjainvirhe” 236 9,0 5,7 
5 Piirtovirhe 171 6,5 6,3 
6 — Puuttuva pitkä vokaali 116 4,4 6,8 
7 Väärä taivutus 102 3,9 7,2 
8 — Puuttuva vokaali 77 2,9 7,5 


ovat äänteiden erotteluun liittyvä vokaalin ja konsonantin sekoittuminen (esimerkiksi i/j) sekä sanan 
kirjoitusasuun liittyvät reversaali, rotaatio, reduplikaatio ja sanan osittainen toisto (kuten altaaseeneen 
‘altaaseen’, voittisisin 'voittaisin'). 

94 Puhekielisyyksistä virhetilastoissa ovat mukana ainoastaan virheellisenä lekseemivalintana tulkittavis- 
sa olevat tapaukset (kun/kuin, vaan/vain, niin/tosi, joka/mikä/kuka). ”Muu lauserakenteen ongelma” 
-kohta kattaa sanatasoa laajemmat virhetyypit (esim. lausekkeen toisto tai puuttuva lauseke). Omina 
kohtinaan on koodattu yleisimmät lausetason ongelmat eli a) väärä sanajärjestys, b) puuttuva/ylimää- 
räinen (yksittäinen) sana sekä c) virheellinen lauseenvastike. Kohta puuttuva/virheellinen taivutus 
sisältää myös kongruenssivirheet ja väärin valitut rektiosijat. 


95 Alkukirjainvirheet eivät ole mukana virhetiheyttä koskevissa analyyseissa. 


wu 
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9 Puuttuva konsonantti 77 2,9 78 
IO — Väärä sana 77 2,9 81 
H — Ylimääräinen geminaatta 73 2,8 8,3 
12 — Puuttuva sana (muu) 71 2,7 8,6 
3 — Puuttuva taivutus 62 2,4 8,9 
14 Ylimääräinen pitkä vokaali 42 1,6 9,0 
15 — Väärä vokaali 41 1,6 9,2 
16 — Väärä konsonantti 37 1,4 9,3 
17 — Rauniosana 37 14 9,5 
18 Irrallinen sananosa 68 2,6 9,7 
19 — Ylimääräinen vokaali 29 1,1 9,8 
20 Ylimääräinen konsonantti 27 1,0 9,9 
21 Soinnillisuus 25 0,9 10,0 
22 Astevaihtelu 24 0,9 10,1 
Yhteensä 2634 100 


Taulukko 45. Yleisimmät virhetyypit kertomusteksteissä 5.—6. luokalla. 


Virhetyyppi Vrt. f % Kumulatiivinen 
2.—3. luokka tiheys /100 sanaa 
Í Ylimääräinen sanaraja I 323 19,0 0,9 
2 Väärä taivutus 7 183 10,8 1,4 
3 Puuttuva sanaraja 3 161 9,5 1,9 
4 Alkukirjainvirhe 4 120 7,1 2,2 
5 Puuttuva geminaatta 2 103 6,1 2,5 
6 — Väärä sana 10 93 5,5 2,8 
7 Puuttuva pitkä vokaali 6 92 5,4 3,1 
8 Piirtovirhe 5 82 4,8 3:3 
9 Puuttuva sana (muu) 12 81 4,8 3,5 
10 — Ylimääräinen geminaatta II 59 3,5 3,7 
11 Puuttuva taivutus 13 56 3,3 3,8 
12 Puuttuva konsonantti 9 46 2,7 4,0 
13 Puuttuva vokaali 8 46 2,7 4,1 
14 — Ylimääräinen konsonantti 20 40 2,4 4,2 
15 Muu lauserakenteen ongelma 40 2,4 43 
16 — Sanajärjestys 33 1,9 4,4 
17 — Astevaihtelu 22 33 1,9 45 
18 — Väärä konsonantti 16 31 18 4,6 
19 — Ylimääräinen pitkä vokaali 14 25 L5 47 
20 Väärä vokaali 15 22 1,3 47 
21 Irrallinen sananosa 18 16 0,9 4,8 
22 Rauniosana 17 13 0,8 4,8 
Yhteensä 1698 100 


KIRJOITTAMISEN TARKKUUDEN KEHITTYMINEN JA YHTEYS KIRJOITTAJAN ... 331 


https://doi.org/10.21435/skst.1472 


FREKVENTIT VIRHETYYPIT KIRJOITTAJARYH MITTAIN 
Poikien kirjoittaminen on molemmissa kieliryhmissä ja useiden eri kie- 
lenpiirteiden osalta keskimäärin epätarkempaa kuin tyttöjen: virheitä 
tehdään useammin (ks. kaavio 13). Tämä vastaa aikaisempien tutkimus- 
ten havaintoja kirjoitustaidosta eri ikävaiheissa (ks. esimerkiksi Mäki 
2002; Pajunen 2012). Myös lukivaikeusriskiryhmässä oikeinkirjoitustai- 
doissa on havaittu alkuopetusvuosina eroja sukupuolten välillä tyttöjen 
eduksi, ja varhain lukemaan oppineilla pojilla kiinnostus kirjaimiin oli jo 
esiopetusvaiheessa tyttöjä vähäisempää ja tehtävää välttävä strategia tyt- 
töjä yleisempi (Lerkkanen ja muut 2010). Koska poikien kirjoittaminen 
tarkastellussa aineistossa on myös sanamääräisesti niukempaa ja ker- 
tomusrakenteen saavuttaminen harvinaisempaa, on perusteltua kuvata 
poikien kirjoittamista tässäkin tutkimuksessa keskimäärin selvästi tyttöjä 
heikommaksi. Mikäli tarkastellaan yksinomaan kirjoittamisen virheitä, 
S1-pojilla vaikuttaa kuitenkin olevan ongelmia lähinnä saneen foneemi- 
sen esityksen koodaamisessa kirjoitukseksi,’ kun S2-ryhmässä erot poi- 
kien ja tyttöjen välillä ovat vielä alakoulun alkuvaiheessa laaja-alaisempia. 
Tarkastelluissa S2-poikien teksteissä esimerkiksi sanojen taivuttamisen 
hallinta näyttää kehittyvän keskimäärin tyttöjä myöhemmin. 
Maahanmuuttajataustaisia oppilaita opettaneet opettajat ovat listan- 
neet tyypillisiksi S2-kirjoittamisen virhepiirteiksi pitkien vokaalien ja 
geminaattojen kestot, rektiovirheet, verbien ja adjektiiviattribuuttien 
kongruenssivirheet sekä korvakuulolta kirjoitettujen vasta opittujen sa- 
nojen virheellisen kirjoittamisen (Lyly 2008, 153).97 Kirjoitetun kielen 
sijataivutuksessa lukioikäisillä S2-oppijoilla eniten ongelmia tuottaviksi 
piirteiksi on havaittu objektin sijavalinnat ja paikallissijat (Elo 1998, 36- 
38). Mannisen ja Martinin (2000) mukaan venäjänkielisten ylioppilas- 
kokelaiden tyyppivirheitä ovat kvantiteettiin, viittaussuhteisiin, sanava- 
lintoihin, vokaalisointuun, kongruenssiin, objektiin, verbimuotoihin 
sekä sijataivutukseen liittyvät ongelmat. Vaikka S2-kirjoittajilla tiedetään 
olevan kirjoittamisen haasteita myös virketasolla muun muassa lausera- 


96 Väite voidaan perustella myös sadutusnauhoitusten eli toisen ja kolmannen vuosiluokan oppilailta 
kerätyn suullisen kertomusaineiston avulla (ks. myös Honko 2017a ja 2017b). 

97 Mahdollisia oman äidinkielen vaikutuksia kirjoittamisen puutteisiin opettajat eivät kuitenkaan välttä- 
mättä tarkemmin pysty erittelemään, mikä ei ole ihme, sillä tehtävä on lingvistillekin useimmiten 
vaikea. 
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kenteissa ja virkerajojen hahmottamisessa, suomen opettajat eivät pidä 
näitä leimallisina piirteinä juuri maahanmuuttajataustaisille oppilaille 
(Lyly 2008, 153). Kaikille oppilaille yhteisinä kirjoittamisen pulmapiirtei- 
nä opettajat ovat Lylyn kyselyssä maininneet välimerkkivirheet, virheet 
yhteen ja erilleen kirjoittamisessa sekä puhekielisyydet ja ongelmat 
viittaussuhteissa (joka ja mikä). (Lyly 2008, 153—154). Yleisistä virheistä 
on koululaiskirjoittamisen yhteydessä tapana mainita erikseen myös 
omistusliitteen merkitsemättä jättäminen (ks. esimerkiksi Elo 1998, 36; 
Turunen 2012). Tässä tutkimuksessa olen katsonut possessiivisuffiksin 
merkitsemättä jättämisen puhekielen vaikutukseksi ja varsinaisen virhe- 
analyysin ulkopuolelle. 

Kirjoittajaryhmittäinen tarkastelu kertoo, että sekä alakoulun alku- 
että loppuvaiheessa keskeiset virhetyypit ja niiden väliset voimasuhteet 
ovat ehkä hieman yllättäenkin pitkälti samanlaiset molemmissa kieli- 
ryhmissä. Äänteiden ja äännekestojen merkinnöissä, sanavalinnoissa 
ja taivutuksessa sekä erityisesti sanarajojen ja alkukirjainten merkin- 
nöissä on pulmia paitsi S2-ryhmässä myös syntyperäisten kielenkäyttä- 
jien ryhmässä. Unelmapäivätekstien virheitä ei toisin sanoen voida 
ainakaan ilman tarkentavaa laadullista analyysiä luontevasti luokitella 
siten, että jotkin virheistä olisivat vain S1- tai S2-kirjoittajien virheitä 
(ks. myös Hamp-Lyons 2003, 173), vaan kaikkia yleisimpiä virhetyyppejä 
esiintyy molemmissa kieliryhmissä. Näin on siitä huolimatta, että kysei- 
set virheet ovat S1-kirjoittajilla huomattavasti harvinaisempia ja liittyvät 
useammin puhekielen vaikutukseen eivätkä varsinaisesti kielenhallin- 
nan puutteisiin eli esimerkiksi suomen foneemiston hallintaan. Kaikki 
S2-ryhmän kirjoittajat ovat asuneet Suomessa jo useita vuosia ja noin 
puolet heistä syntymästään saakka. Tämä tasoittaa mutta ei poista kieli- 
ryhmien välistä eroa. 

Yleisimpien virhetyyppien kirjoittajaryhmäkohtaisiin taulukoihin (ks. 
taulukot 46 ja 47) on koottu koko aineiston tyypillisimmät virheet: toi- 
sen ja kolmannen luokan aineistossa 22 yleisimmän virhetyypin listalle 
mahtuvat kaikki koko korpuksessa yli 20 kertaa esiintyneet virheet, vii- 
dennen ja kuudennen luokan aineistossa kaikki yli 10 kertaa esiintyneet 
virheet. Luvuissa ei ole mukana puhekielisyyksistä johtuvia poikkeamia 
yleiskielen kirjoitusasuun eikä alkukirjainvirheitä, joiden määrä molem- 
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missa kieliryhmissä ja molemmissa keruuvaiheissa on hyvin suuri sekä 
virkkeenalkuisten että erisnimistä puuttuvien isojen kirjainten vuoksi. 
Juuri virkkeenalkuisten alkukirjainvirheiden koodaaminen olisi kuiten- 
kin keinotekoista välimerkkivirheiden suuren määrän vuoksi. 


Taulukko 46. Yleisimmät virhetyypit 2.—3. vuosiluokalla kirjoittajaryhmittäin.* 


Virhetyypin osuus % Sı PS TSI S2 PS2 TS2 Yht 
I Puuttuva yhdyssana 27,4 24,2 30,3 10,4 9,4 11,8 — 19,6 
2 Puuttuva sanaraja 16,9 20,7 13,5 9,2 9,5 8,6 13,4 
3 Puuttuva geminaatta 11,2 10,7 17 21,9 23,4 20,0 16,1 
4 Piirtovirhe 7,2 6,5 7,7 7,6 7,2 8,2 7,4 
5 Irrallinen sananosa 41 45 3,8 L5 2,0 0,9 2,9 
6 Puuttuva vokaali 4,0 3,5 4,4 2,5 2,6 2,4 333 
7 Puuttuva konsonantti 3,1 3,0 3:21 3,6 4,4 2,4 3,3 
8 Väärä taivutus 3,1 2,8 3,3 5,9 5,1 7,1 4,4 
9 Ylimääräinen geminaatta 3,1 3,7 2,6 3,2 3,1 3,3 3,2 
10 Puuttuva pitkä vokaali 2,9 3,3 2,6 7,5 7,9 6,9 5,0 
11 — Väärä konsonantti 2,4 2,2 2,6 0,7 0,5 0,9 1,6 
12 Väärä sana 252! 1,7 217. 4,6 3,8 5,8 3,3 
13 Puuttuva sana 1,9 1,5 2,3 4,4 3,3 6,0 3,1 
14 — Soinnillisuus 17 15 2,0 0,3 0,2 0,4 ET 
15 Puuttuva taivutus 1,6 L5 1,7 4,0 3,6 4,4 2,7 
16 Rauniosana 1,4 2,3 0,6 1,8 2,8 0,4 1,6 
17 Ylimääräinen vokaali 1,4 1,5 1,4 1,0 1;2 0,9 1,3 
18 — Väärä vokaali 1,4 1,7 LI 2,3 2,0 2,7 1,8 
19 Ylimääräinen konsonantti 1,2 0,5 1,8 LI 1,2 LI 1,2 
20 Ylimääräinen pitkä vokaali 0,8 1,5 0,2 3,0 3,8 2,0 1,8 
21 Astevaihtelun virhe 0,5 0,5 0,5 1,7 2,0 1,3 1,0 
22 Väärä sanavartalo 0,4 0,7 0,2 Ly 1,2 2,4 1,0 

% yhteensa 100 100 100 100 100 100 100 

kpl yhteensä 1258 599 659 1059 608 451 — 2317 


98 Ei sisällä puhekielisyyksiä eikä alkukirjainvirheitä. Taulukossa on esitetty kunkin virhetyypin esiintymien 
osuus kaikista taulukkoon sisältyvistä virhetyypeistä. Tarkemmat selitteet löytyvät käsittelyluvuista. 
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Taulukko 47. Yleisimmät virhetyypit 5.-6. vuosiluokalla kirjoittajaryhmittäin.99 


Virhetyypin osuus % Sı PSr TSI S2 PS2 TS2 Yht 
I Puuttuva yhdyssana 32,4 — 29,5 35,1 11,2 13,6 9,4 19,2 
2 Puuttuva sanaraja 16,4 21,5 11,3 6,6 7,5 59 10,3 
3 Puuttuva sanaraja (muu) 6,1 4,4 74 4,6 6,1 3,6 5,2 
4 Piirtovirhe 5,2 8,8 2,7 5,2 5,8 4,8 5,2 
5 Puuttuva geminaatta 4,6 4,0 5,1 7,8 10,0 6,2 6,6 
6 — Ylimääräinen geminaatta 4,4 44 45 3,4 2,2 4,3 3,8 
7 Väärä taivutus 3,9 3,2 45 16,4 14,8 17,6 117 
8 Ylimääräinen konsonantti 3,5 2,0 4,8 1,9 0,7 2,8 2,6 
9 Puuttuva konsonantti 3,2 44 2,4 2,8 2,9 2,7 2,9 
10 — Väärä sana 3,2 1,6 45 7,6 5,1 9,4 5,9 
II Puuttuva vokaali 2,9 4,0 2I 3,0 4,4 2,0 2,9 
12 Sanajärjestys 1,9 1,6 On 2,3 1,2 3,0 2,1 
13 Väärä konsonantti 230 2,0 2,1 1,9 Ly 2.1 2,0 
14 Puuttuva pitkä vokaali 1,7 0,8 2,4 8,4 6,3 9,9 5,9 
15 Rakenne i7 1,6 1,8 3,1 2,9 3,2 2,6 
16 Puuttuva taivutus 1,5 12 18 4,8 5,1 4,6 3,6 
17 Pitkä vokaali 1,5 1,2 18 1,3 17 11 1,4 
18 — Ylimääräinen pitkä vokaali 1,4 1,2 1,5 1,7 1,0 2,3 1,6 
19 Astevaihtelun virhe 0,5 0,4 0,6 3,1 2,9 3,2 2,1 
20 Irrallinen sananosa 1,0 1,6 0,6 1,0 132) 0,9 1,0 
21 — Sanarakenne 0,2 0,0 0,3 1,2 17 = 0,9 0,8 
22 Ylimääräinen vokaali 0,8 0,8 0,9 0,6 1,2 0,2 0,7 

% yhteensä 100 100 100 100 100 100 100 

kpl yhteensä 592 251 336 975 412 563 1567 


TOISTUVAT VIRHETYYPIT 

Tässä alaluvussa esittelen tarkemmin aineistossa useimmin toistuvia 
virhetyyppejä: a) sanojen yhteen ja erikseen kirjoittamisen pulmia, b) on- 
gelmia äännekestoissa, c) grafeemien valinnassa sekä d) grafeemien 
piirtämisessä ja siihen liittyen etu- ja takavokaalien erottamisessa, e) vää- 
rässä ja puuttuvassa taivutuksessa sekä f) sanajärjestyksessä ja g) sana- 
valinnoissa. Samalla erittelen kirjoittajaryhmien välisiä eroja kirjoittami- 
sen tarkkuudessa ja sen kehittymisessä. 


99 Ei sisällä puhekielisyyksiä eikä alkukirjainvirheitä. Taulukossa on esitetty kunkin virhetyypin esiintymien 
osuus kaikista taulukkoon sisältyvistä virhetyypeistä. 
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SANARAJOJEN MERKITSEMINEN 
Yhdyssanojen virheellinen merkintä eli osien kirjaaminen erillisinä 
on S1-oppijoilla tyypillisin virhe läpi alakoulun (lajin vaihto koje, uima 
allas), ja se on myös S2-ryhmässä kummassakin keruuvaiheessa toiseksi 
yleisin virhetyyppi. Jo alaluokilla yhdyssanoista on silti onnistuneesti 
kirjoitettu yhteen noin Go prosenttia jokaisessa kirjoittajaryhmässä, 
ylemmillä vuosiluokilla poikien ryhmissä lähes 80 prosenttia ja tyttöjen 
ryhmissä yli 80 prosenttia. Tämä vastaa aikaisempia havaintoja yhdys- 
sanatajun kehittymisestä erityisesti kolmannen vuosiluokan jälkeen 
(Stenberg 2010). 

Yhdyssanavirheet ovat lähes poikkeuksetta yhdyssubstantiivivirhei- 
tä, mikä johtuu muiden sanaluokkien yhdyssanojen vähäisestä esiinty- 
mismäärästä. Niihin yhdistyy molemmissa kieliryhmissä sekä tytöillä 
että pojilla muutakin kirjoittamisen epätarkkuutta — alemmilla luokilla 
noin 20 prosentissa tapauksista (huipu auton, jatski kioski), ylemmillä 
noin 10 prosentissa. Luvut peilaavat sekä pitkien sanojen kirjoittamisen 
vaikeutta, sillä virheitä on yhdyssanoissa enemmän kuin tekstisanoissa 
keskimäärin, että pitkienkin sanojen kirjoittamisen hallinnan kehitty- 
mistä alakoulun aikana. 

Ylimääräisiä sanarajoja esiintyy alakoululaisten aineistossa myös 
yhdistämättömissä sanoissa, mutta nämä virheet eivät ole sattuman- 
varaisia. Ilmiö on yleisin koulunkäynnin alkuvaiheessa, jolloin niin liite- 
partikkeleita, johtimia kuin tavujakin kirjoitetaan välillä omiksi yksi- 
köikseen. Molemmissa keruuvaiheissa useamman esiintymän tapauk- 
sia ovat additiivinen -kin (ennen kin, kavereita kin) sekä -lAinen-loppuiset 
adjektiivijohdokset (kaiken laisia, saman laisia). Toisella ja kolmannella 
vuosiluokalla muutamat oppilaat myös tavuttavat vielä, tosin lähinnä 
paikallisesti, sanoja sanavälien avulla mahdollisesti oikeinkirjoituksen 
tai sanan taipumisen hahmottamisen helpottamiseksi (per hee seen kuu- 
lui, mun lem pi ruo ka on pa ler mon pasta, nukku ma an). Vain hyvin 
pieni osa sanarajavirheistä viittaa silkkaan huolimattomuuteen, piittaa- 
mattomaan kirjoitustyyliin tai laaja-alaiseen sanarajojen hahmottamisen 
pulmaan (siitäalkoisei kkailu). 

Sanojen ketjuttaminen on kertomusaineistossa tyypillisempää pojille 
kuin tytöille, jotka näyttävät oppivan sanarajojen tarkan merkitsemisen 
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keskimäärin varhemmin. Vaikka ketjuttaminen vähenee ylemmillä luo- 
killa, puuttuu sanarajoja molemmissa kieliryhmissä enemmän poikien 
kuin tyttöjen teksteistä. Ketjutusvirheiden syntymiseen ja tulkintaan 
saattaa vaikuttaa tekstien kirjoittaminen käsin. Niissäkin on silti havait- 
tavissa säännönmukaisuutta, kuten pikapuhemuototyyppisiä yhdistel- 
miä (jolvoi), määritteen ja edussanan yhdistelmiä (kokopaikan, pahaolo, 
parituntia) sekä taipumattomien pikkusanojen, esimerkiksi kanssa-post- 
position ja konjunktioiden sekä kieltoverbin yhdistämistä muihin sanoi- 
hin (iskänkaa, juurikun, eituo). Ketjuttamisvirheiden kasautuminen mer- 
kinnee, että sanojen ominaislaadulla ja toisaalta sanojen painottamisella 
on kirjoittamistavasta riippumattomia systemaattisia vaikutuksia siihen, 
mitkä sanat mielletään yhteen kuuluviksi. 

Sanarajojen kirjoittamisen vaikeudet voivat olla satunnaisia lipsah- 
duksia tai kertoa normien tuntemuksen puutteista tai piittaamattomuu- 
desta normeja kohtaan. Myös sanan ominaispiirteet vaikuttavat sen kir- 
joittamisen vaikeuteen, sillä lyhyet ja nominatiivimuotoisen määritteen 
omaavat sanat kirjoitetaan yleensä muita tarkemmin (ks. myös Stenberg 
2010). Sanojen yhteen ja erilleen kirjoittamisen taito kehittyy, kun kirjoi- 
tetun yleiskielen normit tulevat tutuiksi. Yhdyssanojen ja sanaliittojen 
kirjoittamisen tarkkuudella on kuitenkin tekstin pintarakennetta sy- 
vemmälle yltävä tehtävä: Sanarajojen tehtävä on auttaa kirjoituksen ku- 
vaaman käsitteistön ja näistä syntyvien merkityskokonaisuuksien hah- 
mottamista. Jos muodon ja merkityksen yhteys horjuu, lukija joutuu 
ponnistelemaan merkitysten tulkinnassa. Sanojen yhteen ja erilleen kir- 
joittaminen ei ole ”pelkkä oikeinkirjoitusasia”, vaan kyse on myös tavasta 
hahmottaa sanarakenteita ja jäsentää maailmaa kielen keinoin (Eronen, 
Maamies & Räikkälä 1996). Yhdyssanojen kirjoittaminen kertoo, miten 
hahmotamme maailmaa, ja tyypillisessä tilanteessa yhdyssana ilmaisee 
yhden käsitteen. 


ÄÄNNEKESTOT 

S2-ryhmässä eniten epätarkkuutta on alaluokilla geminaattojen kirjoitta- 
misessa. S2-pojilla geminaatta on jäänyt yksinäiskonsonantiksi yli puo- 
let useammin kuin yhdyssana kirjoittamatta yhteen. Ero on merkittävä, 
sillä S1-pojilla suhde on lähes yhtenevästä yhdyssanatiheydestä huoli- 
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matta päinvastainen. Myös S2-tytöillä geminaattavirheet ovat virheistä 
yleisimpiä, vaikka niiden tekstitiheys on pienempi kuin pojilla. 

Suhteellisesti eniten vaikeuksia on tuottanut geminaatta kk (jääkieko, 
karkia, marokoon). Yleisiä ovat myös virheet merkinnöissä Il, mm, nn, pp, 
ss ja tt (sielä, myöhemin, Särkäniemeen, apelsiinii, kansa, kilti), harvinai- 
sempia muutoinkin harvinaisemmissa yhdistelmissä fja rr (lefaa, haras- 
tamaan). Tuloksia voivat selittää oppijan äidinkielen ja mahdollisesti hal- 
litsemien muiden kielten suomesta poikkeava äänteiden yhdistyminen: 
kaksoiskonsonantteja ei välttämättä ole tai niiden joukko on rajatumpi. 
Geminaattatyypeillä voi olla myös akustisia eroja, jotka vaikuttavat tulok- 
siin. Yksi vaikeutta selittävä tekijä saattaa lisäksi löytyä suomen kielen 
astevaihtelun yliyleistämisestä. 

Alaluokilla kestovirheitä on toisinaan useita samassa sanassa (tykän, 
pikusiskole, joukuessa). Tähän voivat vaikuttaa niin pitkien sanojen komp- 
leksisuus (prosessoinnin kuormittavuus), harvinaisuus (ei-tuttuus) kuin 
silkka sanapituuskin (virheitä mahtuu sanaan enemmän). Toisinaan kir- 
joittaja on hahmottanut, että sanaan kuuluu jokin pitkäkestoinen äänne, 
mutta pitkän keston sijainti on paikallistunut väärin (etää, leenän, menni- 
sime, semoisselle). Tällaiset kompensaatiot näyttävät kasautuvan samoille 
kirjoittajille ja olevan ominaisia alimmilla vuosiluokilla käsillä olevalle 
kehitysvaiheelle. Myös oikein merkittyyn pitkään vokaaliin yhdistyy 
usein geminaattavirhe, ja vastaavasti vokaalin kestovirhe reaalistuu 
usein sananmuodossa, jossa on geminaatta (kunnella, liikkelle). Ilmiö 
kuvastaa kestojen merkintöjen tarkentumisen asteittaista luonnetta: sil- 
loinkin, kun kirjoittaja tiedostaa kahdella kirjainmerkillä kirjoittamisen 
konvention idean ja erottaa ainakin osan puhutun kielen kestoeroista, 
hän ei välttämättä erota pitkiä kestoja kaikista äänteistä tai kaikista sa- 
na-asemista tai merkitse kestoja säännönmukaisesti. 

Sekä sukupuoli että kielitausta vaikuttavat geminaattavirheiden suh- 
teelliseen määrään, vaikka yksilölliset erot ovat hyvin suuria. Alaluokilla 
geminaattojen onnistumisprosentti on S1-kirjoittajien teksteissä sekä tyt- 
töjen että poikien ryhmissä keskimäärin yli 95 kaikissa muissa yhtymis- 
sä paitsi mm:ssä, joka on pojilla jäänyt yksinäiskonsonantiksi noin joka 
kymmenennessä tapauksessa. S2-ryhmän pojilla geminaattavirheet ovat 
yleisimpiä: eniten virheitä ovat aiheuttaneet kk (onnistumisprosentti 
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noin 6o %, S2-tytöillä vastaavasti 85 %), pp (70 % / > 95 %), ss (Jo %, 
> 95 %), tt (83 %, 93 %), mm (87 %, 71 %; mukana ei ole monikon 1. per- 
soonaa korvaavia passiivimuotoja) ja Il (90 %, 93 %). 

Vaikka geminaattavirheet ovat suhteellisen yleisiä, alaluokillakin vain 
viiden oppijan tekstissä niitä esiintyy runsaasti, yli ro kappaletta. Kysei- 
sistä oppijoista yksi on toisluokkalainen S1-tyttö, yksi kolmasluokkalai- 
nen S1-poika, kaksi arabiaa äidinkielenään puhuvaa toisluokkalaista poi- 
kaa ja yksi toisluokkalainen vironkielinen tyttö. Havainnot ovat linjassa 
aiemman tutkimustiedon kanssa: Geminaattojen tiedetään yleisesti tuot- 
tavan pulmia aloitteleville kirjoittajille (Kulju & Mäkinen 2009, 510-516, 
524). Toisaalta geminaattavirheet saattavat olla merkki lukivaikeudesta tai 
S2-ryhmässä suomen kielen kestoasteiden omaksumisen keskeneräisyy- 
destä. Oli merkintöjen epätarkkuuden taustalla mitä syitä tahansa, niiden 
vaikutukset ovat alakoulun loppuun mennessä jo hyvin vähäiset: 5.—6. luo- 
kalla S2-poikienkin ryhmässä kaikkien geminaattojen merkintä on on- 
nistunut yli 90-prosenttisesti. Vaikeimpia ovat alakoulun loppuvaiheessa 
tässä kirjoittajaryhmässä olleet nn (oikein 92 %) sekä kk (oikein 94 %). 

Pitkien vokaalien merkinnät ovat kertomusteksteissä jo koulunkäyn- 
nin alkuvaiheessa huomattavasti tarkempia kuin pitkien konsonanttien 
merkinnät, ja jokaisen vokaalin merkinnät tarkentuvat edelleen alakou- 
lun aikana. Vokaali itsessään vaikuttaa suuresti virheiden määrään: yy:n 
ja öö:n merkinnöissä ei esiinny virheitä, koska tavoitemuotoinakin nämä 
ovat harvinaisia. Määrällisesti eniten virheitä on molemmissa keruu- 
vaiheissa aiheuttanut aa:n kirjoittaminen. Alaluokilla ee:n suhteellinen 
virheprosentti on kuitenkin suurin (noin 3,4 %). Myös sana-asemalla 
on merkitystä, sillä pitkät vokaalit redusoituvat kirjoituksessa lähinnä 
painottomista asemista sananlopuista ja keskeltä, eivät sanojen alusta. 
Alakoulun päättövaiheessa enää muutama tapauksista on sanassa (pää) 
painollisessa asemassa. 

Pitkiin vokaaleihin liittyvät virheet ovat Suomessa pitkään asuneilla 
S2-oppijoilla huomattavasti yleisempiä kuin S1-ryhmässä. Vielä toisella 
ja kolmannella vuosiluokalla pitkän vokaalin redusoituminen lyhyeksi 
on lisäksi selvästi yleisempää S2-pojilla kuin S2-tytöillä ja hieman ylei- 
sempää pojilla myös S1-ryhmässä. Alakoulun loppuvaiheessa tyttöjen ja 
poikien välinen ero on kuitenkin kadonnut molemmissa kieliryhmissä. 
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Pitkien vokaalien ja konsonanttien kirjoittamisen haastavuus etenkin 
koulunkäynnin alussa on todettu myös lukuisissa sanelukirjoittamiseen 
perustuvissa aikaisemmissa tutkimuksissa. Näissä tutkimuksissa on ha- 
vaittu, että sanan harvinaisuus ja taivutustyypin tunnusmerkkisyys sekä 
tavun pituus kasvattavat virheen todennäköisyyttä kestojen merkinnässä 
(ks. Kulju & Mäkinen 2009, 510-511). Sanelukirjoittamisessa geminaat- 
tojen ja konsonanttiyhtymien kirjoittaminen on aiemminkin todettu 
äidinkielisille aloitteleville kirjoittajille pitkien vokaalien ja diftongien 
kirjoittamista haastavammaksi (mts. 520). 

Virhetilastoissa huomiota kiinnittää se, että ylimääräisten geminaatto- 
jen (esimerkiksi halussi, päästtä, omaann) tekstitiheys on Sr-kirjoittajien 
teksteissä yhtä suuri kuin puuttuvien pitkien vokaalien, vaikka S2-ryh- 
mässä pitkien vokaalien merkintöjen puutteet ovat huomattavasti ylei- 
sempiä. Molemmissa kieliryhmissä ylimääräisistä geminaatioista suuri 
osa liittyy alakoulun päättövaiheessa jo joko astevaihtelun puuttumi- 
seen (pikkuserkkun), yliyleistämiseen (kauppungille) tai liitepartikkelin 
sisältävien sananmuotojen kirjoitusasuun rajageminaation yhteydessä 
(kenellekkään). Ylimääräiset pitkät vokaalit (uneessa) puolestaan ovat mo- 
lemmissa kieliryhmissä harvinaisia, ja suhteessa eniten tällaisia virheitä 
ovat tehneet S2-pojat alakoulun alaluokilla. Erityisryhman muodostavat 
vierassanat, joiden toisen tavun vokaali tai toisen tavun alkukonsonantti 
on kirjoitettu pitkänä (Austraaliaan, robootti; vamppyyri, intternetin). 

Kertomusaineiston pohjalta voidaan arvioida, että myös osalla Suo- 
messa syntyneistä S2-oppijoista on alakouluvaiheessa jonkin verran 
vaikeuksia paitsi pitkien äännekestojen merkinnöissä myös niiden ha- 
vaitsemisessa. Akustisesti selvimmät tapaukset (painolliset sananalkui- 
set asemat) ovat alakoulun päättövaiheessa kaikissa kirjoittajaryhmissä 
jo hyvin hallussa. Horjunta sekä pitkistä äännekestoista lyhyisiin että 
lyhyistä pitkiin saattaa myös tarkoittaa, että oppijat, jotka tiedostavat ään- 
nekestojen merkitystä erottavan tehtävän ja merkitsemisen tärkeyden, 
päätyvät toisinaan myös ylikorjaamaan kirjoitustaan: he hahmottavat 
kestojen merkitsemisen systeemitasolla mutta eivät vielä kuule tai osaa 
merkitä kestoja tarkasti. 
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GRAFEEMIN VALINTA 
Puuttuva konsonantti (muu kuin geminaattavirhe) on koko aineistossa 
yleisempi konsonanttiyhtymissä kuin vokaalien välissä. Puolivokaalin j 
puuttuminen tekijänimissä selittää jälkimmäisistä tapauksista noin puo- 
let (palvelia, tutkiana). Konsonanttiyhtymissä etenkin akustisesti heikko 
h on jäänyt toistuvasti merkitsemättä (esimerkiksi pereeni "perheeni, voi- 
kaisi ”voihkaisi”), samoin n-äänteen n (esimerkiksi kunigas, sägystä). Ylei- 
siä nämä virheet eivät tutkitussa aineistossa silti ole. Ylemmillä vuosi- 
luokilla selkein yksittäinen konsonanttien poisjääntiä aiheuttava tekijä 
näyttääkin olevan konsonantin akustisen havaittavuuden heikkous. 

Virheellisesti valittujen konsonanttien joukko on hyvin kirjava. Läpi- 
näkyvimpiä kirjoittamisprosessin kannalta ovat vierasperäisten kirjain- 
ten merkintöjen pulmat (asvalttia ’asfalttia’, twstä tv:stä”, Nikaracuassa 
Nicaraguassa’) sekä n/m-merkintöjen epätarkkuus (esin esim”, kauenpa- 
na ’kauempana’), joita esiintyy kaikilla luokka-asteilla. Lähes yhtä yleisiä 
ovat alakoululaisten teksteissä satunnaisen oloiset kirjainten sekoittu- 
miset (joulupuppi joulupukki’, koka ‘joka’, kuninhas ’kuningas’, savoin 
’sanoin’). 

Syyt vokaalien sekoittumiseen pirstaloituvat samaan tapaan kuin vir- 
heellisten konsonanttien tapauksessa. Kirjaimen muodon epätarkkuus 
selittänee muutaman tapauksista (lappuun loppuun’), ja osa S2-kirjoitta- 
jien vääristä vokaaleista näyttäytyy tekstissä todennäköisesti kielitaustas- 
ta johtuviksi. Vokaalit sekoittuvat silti vain harvakseltaan molemmissa 
kieliryhmissä. 


PIIRTOVIRHEET JA VOKAALISOINNUN HALLINTA 
Molemmissa kieliryhmissä yli 80 prosenttia kaikista piirtovirheistä on 
puuttuvia ä:n pisteitä, muita esimerkiksi puuttuva t:n viiva. Alimmilla 
vuosiluokilla ä:n ja 6:n pisteiden merkitsemättä jättäminen lienee melko 
yleisesti oikeinkirjoituksen lipsahdus, vaikka puutteellinen suomen 
kielen vokaaliharmonian hallinta saattaa ilmentyä tekstissä yhtenevällä 
tavalla, eikä vokaaliharmonian hallinnassa ilmene edistyneillä S2-oppi- 
joilla tai äidinkielisillä kirjoittajilla juuri edes satunnaisia puutteita. 
Molemmissa aineistoissa sananalkuiset ja sanansisäiset ä:t ovat 
redusoituneet a:ksi loppuasemaista ä:tä useammin, mikä on loogista 
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kirjoitussuuntaa ja kirjoitusjärjestystä ajatellen: monille kirjoittajille 
on tyypillistä palata merkitsemään pisteet sanahahmon valmistuttua. 
Molemmissa kieliryhmissä a/ä-vaihtelua esiintyy sekä sanavartaloissa 
että sijapäätteissä ja enimmäkseen aivan tutuissa mutta myös harvinai- 
semmissa sanoissa. Molempien kieliryhmien teksteissä esiintyy tapauk- 
sia, joissa virheeseen yhdistyy muita äännetason virheitä. S2-ryhmässä 
useamman erityyppisen virheen kasautuminen samaan tekstisanaan on 
tosin kaiken kaikkiaan yleisempää. Ylemmillä vuosiluokilla piirtovirheet 
ovat samantyyppisiä kuin alaluokilla, mutta niiden tekstitiheys on mo- 
lemmissa kieliryhmissä selvästi vähentynyt. S2-teksteissä niiden määrä 
on yhä tekstimassaan suhteutettuna noin kaksinkertainen verrokki- 
aineistoon verrattuna. 


TAIVUTTAMISEN ONGELMAT 
Kontekstissaan virheellisiä taivutusmuotoja esiintyy kaikkien kirjoittaja- 
ryhmien teksteissä. Taivutuksen puuttuminen (nomini perusmuodossa 
tai verbi 1. infinitiivissä) on jo alaluokilla kuitenkin harvinaisempi virhe 
kuin muuhun virheelliseen taivutusmuotoon päätyminen. Yleisimpiä 
taivutusvirheet ovat S2-ryhmässä, jossa siinäkin taivutuksen virhetiheys 
jää noin yhteen sanaan sataa tekstisanaa kohden. S1-kirjoitelmissa taivu- 
tusvirheiden esiintymistiheys laskee alakoulun aikana edelleen jo lähtö- 
kohtaisesti hyvin matalasta tasosta (tekstitiheys 0,2 — 0,1). S2-oppijoilla 
taivutusvirheiden tekstitiheys hiukan kasvaa (0,9 — 1,0), mutta kun 
tarvittavan taivutusaineksen puuttuminen kokonaan on aiempaa har- 
vinaisempaa, kokonaisuudessaan taivuttaminen on tarkentunut (1,4 > 
1,3). Näin on siitä huolimatta, että teksteissä käytetty sanasto on moni- 
puolistunut, lekseemi-, sane- ja tekstipituudet kasvaneet ja kompleksis- 
ten rakenteiden käyttö yleistynyt. 

Nominien taivutusvirheistä eniten on objektivirheitä, joita esiintyy 
S2-kirjoittajilla paikallissijan valintavirheitä enemmän mutta Sr-kirjoitta- 
jilla vain muutamia. Objektin sijavalinta ja muodostus tiedetäänkin yh- 
deksi suomen kielen oppijoita eniten haastavaksi rakennepiirteeksi (ks. 
esimerkiksi Martin 1995; Spoelman 2013). Nominivirheistä subjektin 
vääriä sijavalintoja sekä vääriä paikallissijamuotoja esiintyy niin ikään 
harvakseltaan molempien kirjoittajaryhmien teksteissä. Sekä nominien 
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että verbien taivutuksessa esiintyy myös jonkin verran yksikön ja moni- 
kon valintaan liittyviä luvun virheitä, vaikka niitäkin korpuksen ko- 
koon nähden vähän. Lukuun ja subjektin sijavalintaan liittyviä virheitä 
S2-oppijoiden teksteissä ei esiinny juuri verrokkiryhmää useammin, 
paikallissijan valinnassa sen sijaan on vaikeuksia hiukan enemmän. 
Kongruenssivirheitä (esimerkit 11-12) esiintyy kaikkien kirjoittajaryh- 
mien teksteissä niin alimmilla luokilla kuin alakoulun loppuvaiheessa- 
kin. Kongruenssivirheet eivät kuitenkaan ole systemaattisia yhdelläkään 
kirjoittajalla, ja niiden kokonaismäärä on vähäinen. 


11) onhan meilläkin tänä viikollakin kivaa (2. lk. PS1) 
12) Ei olisi koulua puoli vuoteen (5. Ik. TS2, vietnam, SS) 


Verbintaivutuksessa pulmat kietoutuvat lähes aina kompleksisten raken- 
teiden, kuten kieltomuotojen ja verbiketjujen, yhteyteen. Satunnaisia 
puutteita on silti molemmissa kieliryhmissä myös predikaattiverbin 
persoonamuotojen valinnassa ja satunnaisesti moduksen ja tempuksen 
valinnassa. 

Sanojen taivuttaminen ei ole kertaluonteisesti opittava ilmiö. Yksi ja 
sama kielenoppija saattaa ymmärtää jonkin taivutuspäätteen funktion, 
vaikka ei itse vielä käytä päätettä lainkaan, tai hän saattaa käyttää sitä 
puutteellisessa muodossa tai vain tutun konstruktion osana. Senkään 
jälkeen, kun tietty taivutusmuoto on ilmaantunut oppijan kirjoitukseen, 
käyttö ei siis välttämättä ole kattavaa. Äidinkielenään arabiaa puhuvan 
mutta Suomessa syntyneen toisluokkalaisen tytön kertomustekstin esi- 
merkit 13-15 havainnollistavat ilmiötä: monisanaisissa nominilausek- 
keissa edussana on toistuvasti päätteetön. Toisaalta kongruoiva määrite 
taipuu näissäkin tapauksissa usein oikein ja myös edussanasta esiintyy 
virheettömästi taivutettuja objektimuotoja. 


13) Eka on se että haluaisi oman kannettava tietokone. — — toivoisi vielä 
oman leikki huone. 

14) Menin kauppaan ja ostin vaatteita ja ostin kenkä ja sain jäätelöä. 
15) Neljäs on se että saisi ison trampoliinin. Ja kultainen talo. 
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Rektiovirheitä esiintyy niin ala- kuin yläluokilla ja molemmissa kieli- 
ryhmissä tytöillä ja pojilla, vaikkakin jälleen tiheämmin S2-teksteissä. 
Lähes kaikki rektiovirheet liittyvät verbitäydennyksien taivutusmuodon 
valintaan, vaikka muitakin esimerkkejä löytyy (Talo oli tehty kultalla, se 
unelmoi kissaa; kolmekymmentä euron maksava, ennen lähdömme, kaikki 
ikäiset ”kaiken ikäiset’). 

Kaikki S2-oppijoiden teksteissä useita kertoja esiintyvät taivutusvirhe- 
tyypit ovat sellaisia, joiden oppiminen aiemman tutkimuksen perusteel- 
la tiedetään haasteelliseksi (esimerkiksi Martin 1995; Ivaska 2009; Nii- 
ranen 2010; Reiman 2011; Spoelman 2013; Mustonen 2015). Subjektin 
sijavalintavirheissä huomiota kiinnittää partitiivisubjekti. Kieliryhmille 
yhteinen piirre on, että partitiivista esiintyy muutaman kerran sekä yli- 
että alikäyttöä. Mitenkään yleisiä subjektin sijavalintaan liittyvät pulmat 
eivät tässä edistyneiden kielenoppijoiden ryhmässä kuitenkaan ole. Pai- 
kallissijoista ovat tuottaneet vaikeuksia lähinnä olo- ja tulosijat (inessii- 
vi, adessiivi, illatiivi, allatiivi), mutta kaiken kaikkiaan tämäntyyppiset 
valintavirheet ovat jo alaluokilla harvinaisia molemmissa kieliryhmissä, 
ja hyvin harvoin paikallissija on kokonaan merkitsemättä (ks. esimer- 
kit 16-18). Lause- ja virkerakenteiden kompleksistuessa paikallissijojen 
valintaan liittyvien virheiden määrä on säilynyt ylemmillä vuosiluokilla 
ennallaan. Taivutusvirheet eivät toisin sanoen katoa ylemmillä luokilla, 
mutta yhä useammin ne ilmenevät aiempaa kompleksisempien lause- 
rakenteiden yhteydessä, mikä vastaa myös Lesosen (2020) tuloksia. 


16) Oli kaunis ilma harjoitella golfia yksin kauniissa kentässä. 

(5. Ik. TS1) 

17) Ja niinpä IsoBritannia siihen aion lähteä (6. lk. PS2, vietnam, SS) 
18) kun Emilianäi jäätelöäsi] tuli pääsä unelmin. (2. lk. TS2, arabia, 
5 vuotta Suomessa) 


SANAJÄRJ ESTYS JA SANASTON TARKKUUS 

Sanajärjestykseen liittyvät epätarkkuudet lisääntyvät ylemmillä luokilla. 
Se on hyvä esimerkki uuden asian haltuun ottamisen vaiheesta, jossa 
tarkkuuden kehittyminen seuraa kompleksistumiskehitystä. Sanajär- 
jestyksen epätarkkuudet yhdistyvät lähes poikkeuksetta kasvavaan virke- 
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pituuteen useampilauseisissa virkkeissä, joissa lisäksi on saatettu käyt- 
tää kompleksisia rakenteita kuten lauseenvastikkeita ja verbiketjuja (ks. 
esimerkit 19 ja 20). 


19) Noustuani päätän mennä rinneravintolaan syömään, joka on 
Ursuksen yläpuolella. (6.1k. S1P) 

20) Päätimme vielä yrittää liikunnanopettajalle tehdä metkun ja se 
onnistui. (6.1k. S1T [A]) 


Ongelmavirkkeissä on usein käytetty haastavaa kieltomuotoa ja sen yh- 
teydessä indefiniittipronominia sekä erityistapauksissa vielä objektia. 
S2-kirjoittajille pulmia ovat verrokkiryhmää enemmän tuottaneet myös 
lausetta täydentävien ajanilmausten sijainti ja sisäinen rakenne. Koko 
aineiston tasolla sanajärjestys hallitaan kuitenkin molemmissa kieliryh- 
missä erittäin hyvin (vrt. muun muassa Elo 1998, 36). 

Leksikaalisiin valintoihin liittyviä virheitä on totuttu pitämään oppi- 
jankielessä yleisinä ja ongelmallisina virheinä, koska niiden on ajateltu 
johtavan helposti vääriin tulkintoihin (Read 2000, 200-201). Etenkin 
leksikaaliset virheet yhdessä rajoittuneen kokonaissanaston kanssa 
voivat myös ohjata lukijan tulkintaa voimakkaan negatiiviseksi tekstin 
mahdollisista muista ansioista huolimatta (Meara, Rodgers & Jakobs 
2000, 346). Agustin Llachin (2011, 165, 172) tutkimuksessa kouluikäis- 
ten englanninoppijoiden kirjoitelmien laatu (holistinen arvio) korreloi 
voimakkaasti juuri leksikaalisten virheiden esiintymisen kanssa.'** Ala- 
koululaisten kirjoitelmissa leksikaaliset virheet eivät lähellekään aina sil- 
ti aiheuta väärinymmärtämisen vaaraa, ja vain harvoin valittu lekseemi 
on tarkastelluissa kertomuksissa täysin sopimaton. Selkeästi virheellisiä 
sanavalintoja kertomusteksteissä esiintyy hyvin vähän, sekä alemmilla 
että ylemmillä vuosiluokilla alle sata tapausta. Syntyperäisillä kirjoittajil- 
la virheellisiksi merkittyjä sanavalintoja on molemmissa keruuvaiheissa 
saman verran kuin S2-kirjoittajilla. Tämä havainto poikkeaa osin toisen 
kielen oppimisen aiemmista tutkimuksista, joissa leksikaalisten vir- 


100 Yhteys ei välttämättä säily samankaltaisena oppimisen eri vaiheissa. Agustin Llachin (2011, 178) tut- 
kimuksessa korrelaatio kääntyy osittain toisensuuntaiseksi ylemmillä vuosiluokilla, mitä voi selittää 
leksikaalisen riskinoton positiivinen vaikutus tekstin sisällölliseen antiin. 
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heiden on havaittu olevan virheistä tyypillisimpiä (ks. Gass & Selinker 
1994, 270-272, tuoreemmin esimerkiksi Pietilä 2012). Eroon vaikut- 
tavat suomen kielen ominaispiirteet (taivutusjärjestelmän vaativuus), 
mutta myös poikkeavuudet tutkimustehtävissä ja tutkittujen oppijoiden 
iässä ja kielitaitotasossa sekä mahdollisesti itse virheiden luokittelutapa 
(Neff ja muut 2007, 208). 

Kertomustekstit osoittavat, että vaikka oppijankieli ei leksikaalisten 
merkitysten suhteen aina ole kovin täsmällistä, sanavalintojen tarkkuus 
on pitkään Suomessa asuneiden S2-kirjoittajien teksteissä kuitenkin 
kehittyneempi kuin oikeinkirjoituksen tarkkuus. Tekstiyhteydessään 
suoranaisesti epäsopivia sanoja käytetään harvoin. 

Rauniosanalla tarkoitetaan sellaista sananmuotoa, jonka oletettu ta- 
voitemuoto on kaukana toteutuneesta sananmuodosta eli jonka kirjoi- 
tusasu poikkeaa tavoitemuodosta esimerkiksi tietyn grafeemimäärän 
verran (Matilainen 1985) tai jonka virhetyyppiä on virheiden lukuisuu- 
den tai limitteisyyden vuoksi mahdotonta määritellä tarkasti (Kulju ja 
Mäkinen 2009, 315). Omassa tutkimuksessani olen käyttänyt raunio- 
sanan määrittelyyn kolmen grafeemin sääntöä: mikäli sanavartalossa 
on vähintään kolmen grafeemin poikkeama tavoitemuotoon tai virheet 
sanamuodon kirjoitusasussa ovat sellaisia, että lekseemi muutoin vaa- 
tii ympäröivän tekstin avulla päättelyä, se on määritetty rauniosanaksi. 
Vaikka käytetty rauniosanamääritelmä on tiukka, rauniosanat osoittautu- 
vat kaikkien kirjoittajaryhmien teksteissä hyvin harvinaisiksi. Alemmilla 
vuosiluokilla rauniosanojen esiintyvyys on tekstimäärään suhteutettuna 
noin kolme kertaa suurempi kuin ylemmillä. Alimmilla luokilla raunio- 
sanoja on enemmän poikien kuin tyttöjen teksteissä, mutta sukupuolen 
välinen ero tasoittuu alakoulun aikana: S1-kirjoittajilla rauniosanoja ei 
enää viidennellä ja kuudennella luokalla esiinny ja S2-ryhmässäkin po- 
jilla huomattavasti aiempaa vähemmän. 

Puuttuviksi sanoiksi on katsottu tapaukset, joissa lauserakenteen 
ongelmat voitaisiin korjata lisäämällä tekstiin puuttuva sana, yleensä 
subjekti, predikaatti tai objekti. S1-kirjoittajilla tällaiset tapaukset ovat 
alimmilla vuosiluokilla huomattavasti harvinaisempia kuin S2-kirjoitta- 
jilla, ja lauseesta puuttuu pääjäsen ani harvoin. Virkkeiden pidentyessä 
ja virkerakenteiden kompleksistuessa erityisesti verbiketjujen virheet 
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lisääntyvät (ks. esimerkit 21-23). S2-pojilla puuttuvien sanojen teksti- 
tiheys on alakoulun päättövaiheessa muita suurempi, mihin vaikuttaa 
sekä virheiden esiintyminen useammalla oppijalla että puuttuvan sanan 
tyyppivirhe muutamalla kirjoittajalla. 


21) Se on minun lempi pelaaja ja hän O minun mielestäni maailman 
paras. (5. lk. PS2, albania, SS) 

22) Olen unelmoinut Ø delfiinin kouluttajaksi. (5. Ik. TS1) 

23) Minun unelmien päivä on, että juuri perjantaina meillä oppilailla 
on vapaapäivä ja O nukkua paljon (6. lk. PS2, albania, SS) 


Tarkkuuden yhteys kirjoittamisen muihin osataitoihin 
ja kirjoittajan kokonaiskielitaitoon 


Tarkastelen lopuksi kirjoittamisen tarkkuuden yhteyttä sanastonhallin- 
taan, suomen kielen taitoon sekä oman äidinkielen taitoon. S1-oppijat 
ovat mukana vertailussa soveltuvin osin. 


YHTEYS KIRJOITTAMISEN OSATAITOIHIN 

Tarkkuuden vertailumuuttujina toimii kolme kertomustekstien kielellis- 
tä kehittyneisyyttä kuvaavaa muuttujaa: a) sanaston monimuotoisuus™, 
b) harvinaisten sanojen osuus'* sekä c) tavoitemuodon mukaan korjattu 
sanepituus, jotka kaikki tiedetään kielellisen kehityksen mukaan karttu- 
viksi ominaisuuksiksi (ks. tarkemmin esimerkiksi Malvern & Richards 
2004; Crossley ja muut 2010). Tiiveimmin näistä tekstin ominaisuuk- 
sista kirjoittamisen tarkkuus on tutkitussa koululaisaineistossa yhtey- 
dessä sanaston monimuotoisuuteen: Mitä monipuolisempaa sanastoa 
kirjoitelmassa on käytetty, sitä pienempi virhetiheys siinä on todennä- 
köisesti ollut. Toisen vuosiluokan jälkeen yhteys on kaikilla vuosiluokilla 
tilastollisesti merkitsevä tai erittäin merkitsevä (p<o,01 tai p<0,001). 
Yhteys selittyy etenkin S1- ja S2-kirjoitelmien voimakkailla keskimää- 


101 D-indeksiin perustuva sums of probabilities -diversiteettiarvo. 
102 Yleisyystasoa 1000 harvinaisemmat sanat, vertailukorpuksena CSC:n lekseemilista. 
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räisillä eroilla molempien piirteiden suhteen: sanaston monimuotoi- 
suus on S1-kirjoitelmissa selvästi korkeampi ja virhetiheys pienempi 
(mediaanien erot erittäin merkitsevät). Alaryhmätasolla (PS1, TS1, PS2, 
TS2) yhteys on kuitenkin kohtalaisen voimakas ainoastaan viidennen 
vuosiluokan S1-tyttöjen ja kuudennen vuosiluokan S2-tyttöjen ryhmissä 
(t,S-0,350, Pp<0,05, Nis, = 46, n,,, = 27). Tulosta voi tulkita niin, että 
sekä kirjoittamisen tarkentuminen että sanaston käytön monimuo- 
toistuminen ovat kehityksellisiä piirteitä, jotka tuovat osaamistason erot 
esille sitä selvemmin, mitä suuremmat ryhmän sisäiset taitoerot ovat 
ja mitä paremmin kirjoittajat ovat kirjoittaneet omalla taitotasollaan. 
Esimerkiksi heikko kirjoitusmotivaatio tai tarkkaavuus tilanteessa kui- 
tenkin estää kirjoittajaa osoittamasta parhaita taitojaan; tosin motivaa- 
tiotekijät näyttävät vaikuttavan voimakkaammin tekstin tarkkuusominai- 
suuksiin kuin sanaston monimuotoisuuteen. 

Saneen tavoitepituuden ja virhetiheyden välillä ei ole alimmilla vuosi- 
luokilla lineaarista yhteyttä missään yksittäisessä kirjoittajaryhmässä, 
mutta koko kertomuskorpuksessa tarkkuus korreloi löyhästi sekä sana- 
pituuden että runsaampien taivutuselementtien käytön kanssa toisella 
ja viidennellä vuosiluokalla (r ~0,4, p<o,05). Kompleksisuus ja tarkkuus 
näyttävät silti kehittyvän eri tahdissa: toisella vuosiluokalla keskimää- 
räisen sanepituuden ja virhetiheyden välinen yhteys on positiivinen, 
kolmannella vuosiluokalla enää hyvin heikosti positiivinen ja kääntyy 
viidennellä negatiiviseksi. Havaintoa on tulkittava siten, että koulunkäyn- 
nin alkuvaiheessa pisimpiä sananmuotoja tavoittelevissa kirjoitelmissa 
esiintyy keskimäärin myös eniten virheitä, ja vasta ylemmillä vuosi- 
luokilla mekaanisten kirjoitustaitojen alkaessa vakiintua sanepituus 
lakkaa laajamittaisesti kasvattamasta virheiden todennäköisyyttä. Erityi- 
sesti koulun aloitusvaiheessa suomen kielen pitkät sanat kuormittavat 
sana- ja tavurakenteiden prosessointia, ja samoilla lapsilla on usein vai- 
keuksia sekä näiden tarkassa kirjoittamisessa että sujuvassa lukemisessa 
(Mäkinen 2007). Tulos on linjassa myös Malvernin kumppaneineen 
esittämän havainnon kanssa: oppimisen alkuvaiheessa oikeakielisyys- 
virheiden määrä on pienin teksteissä, joissa keskimääräinen sanapituus 
on pienin (Malvern ja muut 2004). Tämän tutkimuksen aineistossa kor- 
kea sanepituus alkaa (vasta) viidennellä vuosiluokalla yhdistyä alhaiseen 
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virhetiheyteen, ja silloinkin alaryhmistä ainoastaan S1-oppijoiden ryh- 
mässä (r, = -0,322, p<o,01, n = 77). 

Kiintoisaksi osoittautuu myös harvinaisten sanojen tekstitiheyden ja 
kirjoittamisen tarkkuuden välinen yhteys. Koko aineiston tasolla mittarit 
asettavat tekstit toisella vuosiluokalla samansuuntaiseen paremmuus- 
järjestykseen: mitä enemmän harvinaisia sanoja tekstissä on käytetty, 
sitä suurempi tekstin virhetiheys todennäköisesti on ollut. Aikaisemmin 
samansuuntaisia havaintoja suomen sanojen yleisyyden ja niiden kir- 
joittamisen tarkkuuden suhteesta on tehnyt Pekonen (2007). Korrelaatio 
on kuitenkin hyvin matala eli harvinaisten sanojen käytön selitysvoima 
virheiden määrään on alhainen, vaikka suurehkossa ryhmässä tulos on 
tilastollisesti merkitsevä (r, = 0,212, n = 198). Yhteys muuttujien väliltä 
katoaa jo kolmannella vuosiluokalla ja korrelaatio pysyy lähellä nollaa 
alakoulun loppuun saakka. Ainoastaan S1-poikien ryhmässä harvinais- 
ten sanojen runsas käyttö lisää virheiden todennäköisyyttä vielä ylem- 
millä vuosiluokilla." 


YHTEYS KIRJOITTAJAN SUOMEN KIELEN TAITOON 

On mahdollista, että virheettömästi kirjoittavat koululaiset ovat kirjoit- 
tajina pedantteja mutta eivät erityisen taitavia kokonaiskielitaidoltaan. 
Aiempien tutkimusten perusteella kielitaidon tekijät kuitenkin kumuloi- 
tuvat niin, että kielitaidoltaan vahvat oppijat ovat tyypillisesti vahvoja 
hyvin monilla eri osa-alueilla (esimerkiksi Alderson 2005). Kielellisesti 
lahjakkaat eivät tosin aina motivoidu irrallisista kirjoittamistehtävistä, 
mikä aiemman tutkimuksen valossa pätee erityisesti poikiin. Tutkin 
omassa aineistossani alakoululaisten kielitaitoprofiilin tasaisuutta asian 
valaisemiseksi kahden erityyppisen vertailumuuttujan avulla. Vertasin 
kirjoittamisen tarkkuutta ensinnäkin erillisellä testillä mitattuun suo- 
men kielen sanaston hallintaan sekä toisekseen kyselytiedon'% avulla 
arvioituun suomen kielen yleistasoon: lukemis-, puhumis- ja kirjoitus- 
taitoon, S2-arvosanaan sekä erityisvaikeuksiin. 


103 Epälineaarinen yhteys muissa, suuremmissa kirjoittajaryhmissä on sinänsä looginen, sillä harvinais- 
ten sanojen käyttöön ja niiden käytön tarkkuuteen vaikuttaa lukuisia ristikkäisiä tekijöitä. 
104 S2-opettajan/luokanopettajan arvio S2-oppilaiden kielitaidosta. 
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Kirjoittajakohtainen kertomustekstin virhetiheys korreloi jokaisella 
vuosiluokalla kohtalaisen voimakkaasti kirjoittajan leksikaalisten tai- 
tojen kanssa, mikäli tarkastellaan koko kirjoittajaryhmää (r,~-o,5, 
p<o,oot; ks. taulukko 48). Yhteys on kaikilla vuosiluokilla negatiivinen 
eli tarkimmin kirjoittavat sanastollisilta taidoiltaan vahvimmat lapset.'® 
Tulos on linjassa toisen kielen oppimisesta aiemmin havaitun kanssa 
(ks. esimerkiksi Llach 2011, 190, 192). Korrelaatio on kuitenkin kaukana 
maksimiarvostaan, mihin vaikuttaa riippuvuuden ehdollisuus. Vaikka 
vahva leksikon hallinta — sekä mahdollisesti tarkkaavuus ja tehtäviin 
suuntautuminen testitilanteessa — yhdistyy virheettömään tai melko 
virheettömään kirjoittamiseen, kaikki tarkat kirjoittajat eivät ole sanas- 
tollisilta taidoiltaan vahvoja. 

Pienemmissä tyttöjen ja poikien alaryhmissä yhteys on aina saman- 
suuntainen. Sanastotehtävistä parhaiten suoriutuneet lapset ovat toden- 
näköisimmin myös tarkkoja kirjoittajia. Koska sanastotehtävät ovat 
edellyttäneet hyvin niukasti kirjoittamista, kirjoitustaito itsessään ei riitä 
yhteyden selittäjäksi, vaan syytä on haettava kielenhallinnan eroista. Erot 
tehtäväorientoituneisuudessa saattavat tosin osittain selittää suoriutumis- 
ta molemmissa tehtävissä ja samalla myös alaryhmien välisiä korrelaatio- 
eroja: etenkään sanastollisesti taitavat S1-pojat eivät näytä motivoituneen 
ylemmillä vuosiluokilla kirjoittamaan parhaan osaamisensa mukaisesti, 


ja juuri tässä ryhmässä taitojen välinen yhteyskin on heikoin. 


Taulukko 48. Virhetiheyden ja sanastotehtäväsuoriutumisen välinen yhteys 
(1,= Spearmanin korrelaatio). 


a Toinen Kolmas Viides Kuudes 
Kaikki -0,450%** -0,450%** -0,568** -0,565*** 
SI KA -0,197* -0,286* -0,462** 
S2 -0,486*** -0,417** -0,430*** -0,582*** 
Pojat (S1) -0,144 -0,155 -0,165 
Tytöt (Sz) -0,193 -0,418** -0,686*** 
Pojat (S2) -0,579** -0,548 -0,269 -0,719*** 
Tytöt (S2) -0,280 -0,181** -0,471** -0,297 


105 On syytä huomauttaa, että sanastollisten taitojen arvioinnissa fonologisella tai morfologisella tark- 
kuudella ei ole ollut merkitystä. 
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Sekä S1- että S2-kirjoittajien opettajille lähetetyssä taustatietokyselys- 
sä on kartoitettu oppijoiden kielellisiä erityisvaikeuksia. Näistä kysely- 
muuttujista muodostetun summamuuttujan oppijakohtaisen arvon 
vertaaminen saman oppijan tekstin virhetiheyteen antaa lisätietoa eri 
oppijaryhmien kielellisten erityisvaikeuksien ja kirjoittamisen tarkkuu- 
den välisestä suhteesta. Niissä kirjoittajaryhmissä, joissa sanastollisten 
taitojen ja kielen virheettömyyden yhteys osoittautui selvimmäksi, 
kielellisten erityisvaikeuksien ja tarkkuuden välillä ei ilmene yhteyttä. 
Tulosta selittää etenkin arvioitujen erityisvaikeuksien vähäinen määrä 
aineistossa. 

S2-oppijoiden ryhmässä on ollut mahdollista tutkia myös kirjoittami- 
sen tarkkuuden ja suomen kielen edellisen todistusarvosanan välistä yh- 
teyttä. Niin S2-tytöillä kuin pojillakin edellinen suomen kielen todistus- 
arvosana on yhteydessä kirjoittamisen tarkkuuteen (S2: r, = -0,37, 
p<o,oo1, n = 91), mutta arvosanaan luonnollisesti vaikuttaa moni muu- 
kin asia, ja yhteys on heikompi kuin tarkkuuden tilastollisesti erittäin 
merkitsevä yhteys sanastollisiin taitoihin. Erityisen mielenkiintoinen 
on opettajan arvioiman kirjoitustaidon yhteys kirjoittamisen tarkkuu- 
teen: tytöillä lineaarinen yhteys on kohtalaisen voimakas ja tilastollisesti 
merkitsevä (r, = -0,438, p<o,001, n = 63) mutta poikien aineistossa sisäi- 
nen hajonta on suurempi eikä riippuvuutta ilmene (r, = -0,136 p>0,05, 
n = 42). Tulos tukenee havaintoa siitä, että pojat eivät ole osanneet 
tai halunneet osoittaa parasta osaamistaan unelmakirjoitelmaa kir- 
joittaessaan tai ainakaan tehneet sitä yhtä systemaattisesti kuin tytöt. 
Kirjoittamistaidon kartoituksissa olisikin jatkossa tärkeää kiinnittää eri- 
tyistä huomiota kirjoittamistehtävään ja sen merkityksellisyyteen eri- 
laisten kirjoittajien näkökulmasta. Toisaalta voi olla, että koska tyttöjen 
kirjoittaminen on keskimäärin poikien kirjoittamista kehittyneempää, 
juuri tyttöjen kirjoitustaidon arvioinnissa opettajat kiinnittävät enem- 
män huomiota myös tarkkuuspiirteisiin. 

Opettajien arvioimista osataidoista suomen kielen puhetaito tai eu- 
rooppalaista viitekehystä mukaileva yleisempi taitotasoarvio eivät tarkas- 
tellussa aineistossa korreloi kirjoittamisen tarkkuuden kanssa. Pääsyynä 
ensimmäiseen lienee vertailuaineiston luonne: monet kirjoittamisen 
virheistä liittyvät nimenomaan kirjoitetun kielen normien hallintaan. 
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Lahes kaikki pikkulapsesta asti Suomessa asuneet koululaiset ovat li- 
säksi jo hyvin sujuvia puhujia, minkä vuoksi puhetaidon karkea arvio 
ei myöskään erottele oppilaiden kielenhallintaa S2-ryhmän sisällä (ks. 
mittarista tarkemmin Honko 2013). Eurooppalaista viitekehystä mukai- 
levan taitotasoarvion ja tarkkuuden heikkoon yhteyteen voidaan nähdä 
kaksi hyvin erityyppistä syytä, joista ensimmäinen liittyy toisen kielen 
oppijan kielenoppimisprosessin vaiheisiin: on mahdollista, että virheet 
lisääntyvät aaltomaisesti eri kielitaitotasoilla, jolloin lineaarista tai edes 
monotonista yhteyttä ei korrelaatioanalyysilla voida havaita (ks. myös 
esimerkiksi Brunni ja muut 2019). Toinen mahdollinen selitys liittyy 
itse mittarin validiteettiin: alakouluikäisen suomenoppijan kielitaidon 
arvioinnissa viitekehyksen mukaiset taitotasot eivät ole olleet kovin help- 
poja soveltaa. 

Kielitaidoltaan vahva ei välttämättä hallitse kirjoitetun kielen normeja 
tai muusta syystä kirjoita tarkasti. Esimerkiksi kuudesluokkalaisen Suo- 
messa syntyneen ja ensikieleltään vietnaminkielisen pojan kertomuk- 
sessa virheettömät fraasit ja idiomaattiset rakenteet (pienestä asti, jonakin 
päivänä, mitä vielä, ne vasta ovatkin herkkuja) sekä sofistikoituneet sanat 
(erityisesti harvinaisten sanojen käyttö) ja rakenteet (kuten elämä ilman 
autoja), konditionaalin ja perfektin käyttö, erilaiset sivulausetyypit ja 
lukuisat onnistuneet objektitaivutukset vartalomuunnoksineen osoitta- 
vat oppijan paitsi käyttävän suomea monipuolisesti myös taitavan 
kompleksisia rakenteita. Toisaalta kirjoittamisessa on vielä puutteita 
muun muassa välimerkityksessä, alkukirjaimissa sekä yhteen ja eril- 
leen kirjoittamisessa. Vaikka kielen rekisteritkin välillä sekoittuvat (naar- 
muks), teksti osoittaa, että kirjoitetun kielen konventioiden oppiminen 
on käynnissä. Tämä näkyy esimerkiksi verbien infiniittimuotojen stan- 
dardinmukaisena viimeistelynä (haaveillut, lähteä vrt. haaveillu, lähtee) 
sekä joidenkin lähinnä kirjoitetussa kielessä esiintyvien konstruktioiden 
käyttönä. Juuri näiden konstruktioiden hiomattomuus (eihän voi olla 
paha mennä, mita mahtavempia) toisaalta kuvastaa oppimisprosessin 
dynaamisuutta. Kun oppija käyttää ilmaisuvarantoaan monipuolisesti, 
rohkeasti ja luovasti ja samalla vasta harjoittelee kirjoitetun kielen nor- 
meja, on luonnollista, että ilmaisuun sisältyy myös epäidiomaattisuutta 
ja epätarkkuutta. 
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YHTEYS KIRJOITTAJAN OMAN AIDINKIELEN TAITOON 
Koulunkäynnin alussa lasten luku- ja kirjoitustaidossa on suuria eroja, 
mutta alkuopetus tasaa eroja nopeasti, kuten tämänkin tutkimuksen 
aineisto osoittaa. Vaikka suomenkielisessä ympäristössä vietetty aika 
tukee kielitaidon kehittymistä erityisesti kouluiässä, myös koko perus- 
koulunsa Suomessa opiskelleilla S2-oppilailla voi olla puutteita suomen 
kielen taidoissa (myös Kuukka & Metsämuuronen 2016, 85). Kirjoitus- 
taidon osalta yksilölliset erot ovat kuitenkin suuremmat oman äidinkie- 
len taidossa. Koulun alkuvaiheessa vain harvat toisen kielen oppijat ovat 
ehtineet oppia kirjoittamaan ensikielellään. Noin 17 prosenttia moni- 
kielisistä oppilaista arvioi oman äidinkielen kirjoitustaitonsa vielä pe- 
ruskoulun päättövaiheessa joko huonoksi tai olemattomaksi (Kuukka 
& Metsämuuronen 2016, 73). On huomattava, että myös yksilöllisissä 
mahdollisuuksissa toiminnallisen kielitaidon kehittämiseen on suuria 
eroja. 

Tähän tutkimukseen osallistuneista vain noin joka kymmenes koulu- 
lainen piti ensikielen kirjoitustaitoaan toisen tai kolmannen vuosiluokan 
kevätlukukaudella suomen kielen kirjoitustaitoaan parempana, ja kolme 
vuotta myöhemmin näin ajattelevien osuus oli edelleen hieman pienen- 
tynyt (Honko 2013). Siksi on ollut erityisen kiinnostavaa tarkastella sitä, 
miten varhaislapsuudesta asti Suomessa asuneiden S2-oppijoiden suo- 
men kielen kirjoitustaito kehittyy suhteessa suomea ainoana kotikielenä 
puhuneisiin ikätovereihin ja toisaalta suhteessa S2-oppijoiden oman 
äidinkielen taitoon. 

Noin puolet tutkimuksessa mukana olleista S2-oppilaista osallistui ai- 
neiston keruuhetkellä oman äidinkielen opetukseen. Näiden oppilaiden 
oman äidinkielen opettajista 21 vastasi kyselyyn, joka oli samansisältöi- 
nen kuin suomen kielen opettajille lähetetty kysely. Vähäiseen vastaus- 
määrään vaikuttaa se, että kaikilla oppilailla ei ole mahdollisuutta tai 
halua osallistua järjestettyyn oman äidinkielen opetukseen sekä se, ettei 
opetusta etenkään vähän puhutuissa kielissä ja pienemmillä paikkakun- 
nilla ollut tarjolla kaikille. Kysely ei myöskään tavoittanut kaikkia opetta- 
jia, eivätkä kaikki tavoitetut opettajat vastanneet kyselyyn. Vastausmäärä 
on tilastollisten analyysien kannalta hyvin pieni. Nostan tässä yhteydessä 
kuitenkin esille joitakin kiinnostavia havaintoja, jotka toimivat avauksi- 
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na keskusteluun ja mahdollisesti tukena laajempiin pitkittäistutkimuk- 
siin tulevaisuudessa. 

Opettajien arvioima oman äidinkielen taito viidennen ja kuudennen 
luokan keväällä ei ainakaan tässä pienessä tutkimusryhmässä vaikutta- 
nut millään käytetyistä mittareista (tarkemmin Honko 2013) olevan 
yhteydessä saman ikävaiheen suomen kielen kirjoittamisen tarkkuu- 
teen. Hieman yllättäen oman äidinkielen taidon ja aikaisemman eli 
toisen ja kolmannen luokan kirjoittamisen tarkkuuden väliltä paljastui 
kuitenkin melko voimakas ja tilastollisesti merkitsevä korrelatiivinen 
yhteys. Tämä yhteys ilmeni erikseen sekä opettajan arvioiman oman 
äidinkielen puhetaidon (r, = -0,51, p<o,o5, n = 21), kirjoitustaidon 
(r, = -0,63, p<o,01, n = 21) että sanastollisten taitojen (r, = -0,62, p<o,01, 
n = 21), edellisen oman äidinkielen todistusarvosanan (r, = -0,56, p<o,01, 
n = 20) ja suomen kielen kirjoittamisen tarkkuuden välillä. Yhteys oli 
aina samansuuntainen: varhaisten kouluvuosien suomen kielen kir- 
joittamisen tarkkuus yhdistyi myöhemmin vahvaksi arvioituun oman 
äidinkielen taitoon. 

Positiivinen yhteys saattaa tukea ajatusta toiminnallisen monikieli- 
syyden eduista eli siitä, että yksilön vahva kielitaito yhdessä kielessä 
voi tukea muidenkin kielten taitojen kehittymistä. Kyse voi olla myös 
yleisemmin kielellisestä älykkyydestä tai taipumuksista, jotka syntyvät 
paljolti ympäristötekijöiden vaikutuksesta mutta osin myös geneettisesti 
(ks. esimerkiksi Kaprio 2006). Yhteyden katoaminen myöhemmässä 
vaiheessa voi merkitä ainakin kahta asiaa. Ensinnäkin kirjoittamisen 
tarkentuessa yläluokilla tarkkuusmittarin erottelevuus luonnostaan vä- 
henee. Toiseksi varhaisen vaiheen vahva suomen kielen taito sekä ehkä 
myös käytettyjä arviointitapoja suosivat yksilölliset ominaisuudet, kuten 
tarkkaavuus, ovat voineet olla eduksi oman äidinkielen taidon kehitty- 
miselle. Lisäksi on mahdollista, että opettajan kyselyyn vastaamisen 
yhteydessä soveltama arviointitapa on suosinut tarkkuutta tai sellaista 
tehtäväorientoituneisuutta, jota tämän tutkimuksen kieliaineiston ke- 
ruussakin on vaadittu ja joka on erotellut oppilaita erityisesti alakoulun 
alkuvuosina. 
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Lopuksi 


Kirjoittaminen tarkentuu alakoulun aikana selvästi kaikissa kirjoittaja- 
ryhmissä. Voimakkainta kehitys on S2-pojilla, joilla kirjoittamisen epä- 
tarkkuus alakoulun alkuvaiheessa oli suurinta. Yleisimpiä ovat sekä 
alakoulun alku- että loppuvaiheessa sanojen yhteen ja erilleen kirjoitta- 
misen haasteet. Etenkin alimmilla vuosiluokilla yleisiä ovat myös puut- 
tuvat geminaatat ja pitkät vokaalit sekä kirjainten piirtämiseen liittyvät 
epätarkkuudet. Alakoulun loppuvaiheessa sanojen taivuttamiseen liitty- 
vät virheet ovat jo hieman näitä yleisempiä. Puhekieli lomittuu kirjoi- 
tettuun yleiskieleen kaikissa kirjoittajaryhmissä — mutta osin hyvinkin 
hallitusti ja kerrontaa tukien. 

Koko kertomusaineistossa virhetiheydellä ilmenee toisen vuosiluokan 
jälkeen negatiivinen yhteys kielenhallintaan, jonka mittarina tässä tut- 
kimuksessa toimi sanaston käytön monimuotoisuus: virhetiheys on 
suhteessa suurin niillä kirjoittajilla, jotka käyttävät yksinkertaisinta sa- 
nastoa. Tätä selittää ennen kaikkea kieliryhmien välinen kielitaitoero: 
sanasto monimuotoistuu ja kirjoittaminen tarkentuu alakoulun aikana 
mutta S2-ryhmässä keskimäärin S1-ryhmää hitaammin. Tarkkuus ja sa- 
narakenteen kompleksisuus puolestaan näyttävät kehittyvän eri tahdis- 
sa; pitkien sananmuotojen tavoittelu lisää virheiden todennäköisyyttä 
vain hieman ja vain alimmilla vuosiluokilla. Lineaarisen yhteyden puut- 
tumista selittää muun muassa suomen kielen pitkien sanojen syste- 
maattinen rakenne: monimorfeemisuus ei automaattisesti tee sanasta 
vaikeaa. Myös harvinaisten sanojen käyttö lisää virheiden todennäköi- 
syyttä tutkitussa aineistossa vain aivan alakoulun alkuvaiheessa. 

Tarkimmin kirjoittavat sanastollisilta taidoiltaan vahvat lapset. Tämän 
yhteyden voimakkuuteen voi kielenhallinnan lisäksi kuitenkin vaikuttaa 
myös yleinen tarkkaavuus ja tehtäväorientaatio. Opettajan arvioimien 
kielellisten erityisvaikeuksien määrään ei ilmene yhteyttä kummassa- 
kaan kieliryhmässä tai kummankaan kielen osalta (suomi, monikielis- 
ten oppilaiden oma äidinkieli), mitä osaksi selittää arvioitujen erityis- 
vaikeuksien vähäinen määrä. Muista opettajan arviointiin nojautuvista 
suomen kielen taitomittareista ainoastaan edellinen todistusarvosana ja 
holistinen arvio kirjoitustaidosta ovat yhteydessä kirjoittamisen tarkkuu- 
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teen tutkimusaineistossa, näistäkin jälkimmäinen ainoastaan tyttöjen 
ryhmässä. On mahdollista, että tytöillä kirjoittamisen tarkkuus vastaa 
paremmin yleistä kirjoitustaidon tasoa ja että poikien ryhmässä teksti- 
taidoista irrotettavat tekijät, kuten tarkkaavuuden tai motivaation puute 
kirjoittamistilanteessa, heikentävät tätä yhteyttä. Kenties yllättävin, mel- 
ko voimakas ja lisätutkimukseenkin rohkaiseva korrelatiivinen yhteys 
S2-aineistossa ilmeni koulunkäynnin alkuvaiheen suomen kielen kirjoi- 
tustaidon (virhetiheys) sekä myöhemmän oman äidinkielen taidon (pu- 
huminen, kirjoittaminen, sanasto) välillä. Oman äidinkielen taitojen 
arviointi perustui useiden eri opettajien tekemiin ja useiden eri kielten 
taitoja koskeviin holistisiin arviointeihin. 

Yleisen virhetiheyden laskeminen ja kaikentyyppisten oikeakielisyys- 
virheiden väheneminen tarkoittavat, että alakouluiässä kirjoittamisen 
tarkkuus kasvaa laaja-alaisesti siitä huolimatta, että kirjoittaminen yhtä 
aikaa sujuvoituu ja kompleksistuu. Vaikka pinnistely yhdellä kielitaidon 
osa-alueella saattaa hetkellisesti laskea suorituskykyä toisella,'** pidem- 
mällä aikavälillä kehitys on kaikkiaan nousujohteista. Monet virheet se- 
littyvät alaluokilla sillä, että kirjoitetun kielen konventioiden tuntemus 
on vielä puutteellista ja kirjoittamisen rutiinit puuttuvat. Esimerkiksi 
geminaattojen kirjoittamisessa äidinkielisilläkin on horjuntaa aluksi 
mutta myöhemmin vain satunnaisesti, kun taas yhdyssanojen kirjoit- 
tamisessa norminmukaisten konventioiden oppiminen ja käyttö on 
kompleksimpi ilmiö, joka haastaa myös aikuisia kirjoittajia. 

Aineisto osoittaa myös selvästi, että poikien kirjoitustaito kehittyy 
keskimäärin tyttöjä hitaammin kaikilla tarkkuuden osa-alueilla ja että 
pitkäkään maassaoloaika ei ole aina auttanut kaikkia Suomessa koulu- 
polkunsa aloittaneita S2-oppilaita saavuttamaan monipuolista ja tarkkaa 
kielellistä ilmaisua. Virheiden olemus ja esiintymisympäristötkin muut- 
tuvat alakoulun aikana, mutta muutokset tapahtuvat eri kirjoittajilla ja 
kirjoittajaryhmittäin eri rytmissä. Tarkkuustarkastelun tulokset vastaa- 
vat nykykäsitystä kielenomaksumisesta: eri kielenoppimisen tasoilla on 


106 Esimerkiksi kirjoitustehtävän sisältöön suunnattu ennakkoharjoittelu saattaa viedä huomiota kielen 
tarkkuudesta ja yllättäen jopa kasvattaa virheiden määrää sen sijaan että vähentäisi niitä, ks. myös 
Skehan 1998, 69, 70-71. 
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omat haasteensa ja omat tyypilliset virhekeskittymänsä (ks. esimerkiksi 
Ellis & Barkhuizen 2005, 78). Voimakkainta kirjoittamisen tarkentumi- 
nen on juuri pojilla sekä toisen kielen oppijoiden ryhmissä, joissa lähtö- 
taso koulunkäynnin alkuvaiheessa on matalin. Näin on siitä huolimatta, 
että juuri pojilla vaikuttaa olleen vaikeuksia osoittaa parasta osaamis- 
taan. 

Kielenoppijoille on luontevaa käyttää teksteissään ilmauksia, jotka 
he jo hallitsevat hyvin (ks. esimerkiksi Folse 2004, 130). Vaikuttaa siltä, 
että tämä pätee kirjoitetussa suomen kielessä erityisesti sanojen mer- 
kityksiin, sillä sanojen käyttö selvästi virheellisessä merkityksessä on 
tutkitussa kirjoitetun kielen aineistossa harvinaista. Kielen yleisimmät 
sanat kuitenkin kattavat hyvin suuren osan teksteistä, mikä väistämättä 
heikentää tekstien ilmaisuvoimaa. Tulosta voi pitää positiivisenakin, sil- 
lä sanaston käytön virheet ja epätäsmällisyydet on katsottu keskeisiksi, 
usein vuorovaikutuksen kannalta merkittävimmiksi kielitaidon puut- 
teiksi (Ellis 1994, 65; Agustin Llach 2011, 91)."°7 Myös kielenkäyttäjät 
itse merkitsevät puheessaan juuri sanastollisia ongelmia epäröintien 
ja puheen uudelleenmuotoilujen kautta (Halonen & Kokkonen 2008, 
132) sekä mieltävät leksikaaliset virheet vakavimmiksi (Gass & Selinker 
1994, 270)."°° 

Oppimisen kannalta pelkästään tutun aineksen käyttäminen ei kuiten- 
kaan ole etu. Virheitä voidaan nimittäin aina tarkastella paitsi osaamisen 
puutteina myös kielellisten resurssien karttumisesta kertovana ilmiönä 
(esimerkiksi Seilonen 2013; Mustonen 2015; Lesonen 2020). Esimer- 
kiksi verbien finiittimuotojen virheitä ei synny, ellei oppija ylipäätään 
käytä infiniittisiä muotoja vaativia rakenteita. Tarkkuusorientoitunut tai 
ylenpalttisesti korjaavaa palautetta saava oppija voi oppia välttelemään 
virheitä ja epävarmoiksi kokemiaan ilmaisutapoja. Lopputuloksena voi 
syntyä virheettömiä tekstejä, mutta samalla tuottamisen sujuvuus ja 


107 Huomattakoon, että suomen kielessä myös virheelliset rakenteet toki saattavat haitata viestin välit- 
tymistä esimerkiksi englannin kieltä useammin jo runsaamman taivutusmorfologian vuoksi. Lisäksi 
englanninkielisessä kirjallisuudessa leksikaalisista virheistä puhuttaessa sisällytetään virhetyyppiin 
usein myös mm. sanan oikeinkirjoituksen virheet ja toisinaan myös taivutuksen pulmat (ks. Agustin 
Llach 2011). 

108 Leksikaalisia virheitä ja niihin suhtautumista on tosin tutkittu lähinnä aikuisten kielenoppijoiden 
kautta, ja kouluikäisen kielestä tietoa on huomattavasti vähemmän (ks. kuitenkin Agustin Llach 2011). 
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monimuotoisuus vähenevät eikä oppija pääse hyödyntämään oppimisen 
koko potentiaaliaan (ks. esimerkiksi Martin ja muut 2010). 

Monipuolisen funktionaalisen kielitaidon saavuttamisen tavoittee- 
seen sisältyy Suomessa kirjallisten konventioiden ja muodollisen kielen 
hallinta, sillä sitä edellyttävät niin jatko-opinnot, työelämä kuin toimivan 
arjen viestintäkin (ks. myös Halonen & Kokkonen 2008, 123-124, 137- 
139; Kalliokoski 2006; 2008). Esimerkiksi suomi toisena kielenä -yli- 
oppilaskokeesta tiedetään, ettei sisällöllisesti ansiokkaalla ja sekä ra- 
kenteellisesti että sanastollisesti monipuolisella kirjoittamisella ylletä 
korkeisiin pistemääriin, mikäli kielivirheitä on tekstissä runsaasti (Elo 
1998, 36). Toisaalta norminvastaisten muotojen käyttäminen voi toi- 
sinaan olla tietoista ja tarkoituksenmukaista (ks. esimerkiksi Halonen 
2009; Lehtonen 2014). 

Kielelliselle tarkkuudelle voidaan funktionaalisen kielikasityksen mu- 
kaisesti asettaa ainakin yksi laaja oppimistavoite: rakenteita ja sanastoa 
on opittava ymmärtämään ja tuottamaan niin hyvin, että merkityksen 
kannalta olennaiset erot tulevat selviksi (Martin 2003, 84; Halonen & 
Kokkonen 2008, 131). Koska kieltä ei kuitenkaan voi opetella tällaisten 
merkityksiä erottavien esimerkkien tai sääntöjen listoina, vaatimuk- 
seen sisältyy loppujen lopuksi valtaisa määrä opittavia asioita: sanoja, 
sanontoja, rakenteita, prosodiikkaa, sävyjä, tyylejä, käytänteitä, vaihtelua 
ja vaihtoehtoisuutta — mutta myös sääntöjä, vaihteluttomuutta ja vaihto- 
ehdottomuutta. Vasta, kun yksilö hallitsee kieltä todella hyvin, hänen on 
mahdollista tietää, miten yksityiskohdat sitoutuvat kokonaisuuksiksi, 
kuinka paljon kokonaisuuksissa on jouston varaa ja mikä lopulta mil- 
loinkin on merkityksen kannalta olennaista. Tutkimuksen keinoin on 
esimerkiksi leksikaaliseen välttelyyn vaikea saada otetta.'*9 Tarkkuus voi 
olla sidoksissa kielellisten taitojen ja tilannetekijöiden lisäksi myös yksi- 
löllisiin kielenkäyttötapoihin. Erityisesti vieraalla kielellä kirjoitettaessa 
kohdekielen äänne-, muoto- ja lauserakenteen sekä kirjoitusjärjestelmän 
etäisyys jo osatuista kielistä mutta myös monet paljon laajemmat tekijät 
kuten kirjoittamisen konventiot ja vuorovaikutuskulttuuri vaikuttavat 


109 Apuna voidaan käyttää esimerkiksi ääneenajattelumenetelmää tai tietoa ilmausten esiintymistoden- 
näköisyyksistä. Rakennetuissa testiympäristöissä suomen kielen oppijoiden turvallisuushakuisuudes- 
ta on näyttöä (ks. esimerkiksi Nissilä 2011, 150). 
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toisaalta siihen, kuinka paljon opittavaa on. Mitä erilaisempaan järjestel- 
mään ja kulttuuriin siirrytään, sitä enemmän kohdekielen mukaisten 
muotojen omaksuminen vaatii aikaa ja harjoittelua. 

Kirjoitustaito ei kehity lineaarisesti tai toteudu samassakaan tekstissä 
aina samalla tavalla, ja etenkin rajatusta aineistosta tehdyt havainnot 
antavat kirjoittamisen tarkkuudestakin toisinaan ristiriitaisen kuvan. 
Tämän tutkimuksen tuloksista ei voi tehdä kauaskantoisia päätelmiä 
yksilön taidoista — tavoite on ollut ryhmätasolla —, sillä kultakin kirjoitta- 
jalta on tutkittu molemmissa vaiheissa vain yksi teksti. Lekin ja muiden 
(2008) mukaan juuri emotionaalinen teksti, kuten kirjoittaminen unel- 
mien päivästä, kuitenkin vaatii tarkkojen ilmausten miettimistä ja vetää 
kirjoittajan huomion tyypillisesti tekstin paikallisiin seikkoihin globaa- 
lien sijaan. Siksi aineistoa voi pitää tutkimustehtävän kannalta perus- 
teltuna. 

Mäkisen (2007) tutkimustulokset rohkaisevat hyödyntämään virhe- 
analyysien tuloksia erityisesti oppilaan puutteellisten kirjoittamisstrate- 
gioiden tunnistamiseen. Virheanalyysiin kytketyn sanarakenneanalyysin 
avulla on Kuljun ja Mäkisen (2008, 524-246) mukaan mahdollista saada 
tietoa erityisesti siitä, minkälaisia ongelmia heikoilla kirjoittajilla on sana- 
rakenteen hahmottamisessa. Sanatasolla alakoululaisilla on vaikeuksia 
erityisesti suomen kielen pitkien äännekestojen kirjoittamisessa, mutta 
on muistettava, että oppimisen kannalta keskittyminen pelkästään näi- 
den kirjoittamisen harjoitteluun ei ole tehokasta. Tarvitaan myös kielel- 
lisen tietoisuuden vahvistamista, esimerkiksi sanarakenteen tajun har- 
joittamista eri tavoin myös puhutun kielen kautta, sekä lukemisen ja 
kirjoittamisen taitojen tarkastelemista ja tukemista vuorovaikutteisesti. 

On mahdollista, että tässä tutkimuksessa havaitun kaltaisia taitoeroja 
eri kirjoittajaryhmien välillä voitaisiin vähentää tunnistamalla kielellisen 
prosessoinnin ja opiskelutaitojen puutteita yli kielirajojen ja tukemalla 
tehokkaita lukemisen, kirjoittamisen ja opiskelun strategioita yhtä ai- 
kaa oppilaan kaikissa kielissä. Tiedetään, että sanarakenteen hahmotta- 
minen vaikuttaa niin lukemisen kuin kirjoittamisen oppimiseen (ks. 
esimerkiksi Kulju & Mäkinen 2009). Tiedossani ei kuitenkaan ole tutki- 
muksia, joissa olisi tarkasteltu aloittelevien monikielisten lukijoiden ja 
kirjoittajien taitoja tai kielenhallintaa ja niiden tukemista yhtä aikaa suo- 
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men kielessä, omassa äidinkielessä ja mahdollisesti jo opiskeltavissa 
muissa kielissä. Tarvitaan lisätietoa myös siitä, suosiiko kirjoittamisen 
opetus ja arviointi tietyntyyppisiä opiskelu- tai vuorovaikutustapoja niin, 
että oppimisprofiilien tasoittamisen sijaan opetus voi jopa ruokkia kir- 
joittamisen taitoerojen syntymistä. Parhaimmillaan opetuksessa pysty- 
tään aidosti tukemaan erilaisia ja erilaisissa oppimisen vaiheissa olevia 
kirjoittajia, esimerkiksi tunnistamaan taitoerojen lisäksi yksilölle merki- 
tyksellisiä kirjoittamisen tapoja ja tavoitteita sekä muokkaamaan opetus- 
ta ja arviointia näiden havaintojen pohjalta. 

Kirjoitetun kielen normien tuntemus karttuu kouluaikana nopeasti. 
Toiminnallisen kirjoitustaidon näkökulmasta sääntöpohjainen opetus 
ei kuitenkaan ole kirjoittamistaidon kehittymisen kannalta tehokkainta. 
Shoren ja Rapatin (2014) pohjalta voidaan esittää, että kirjoittamisen 
tarkkuutta lisää ja kirjoitustaitoa vahvistaa pintatason virheiden korjaa- 
mista tehokkaammin keskittyminen merkitysten selventämiseen. Tark- 
kuuden kannalta keskeistä on ymmärtää sääntöjen merkitys ja oppia 
ohjatusti harjoittelemalla, miten sääntöjä on tarkoitus soveltaa erilaisissa 
teksteissä ja vuorovaikutustilanteissa. Kirjoittamisen opettamisessa ja 
ohjauksessa on tärkeää tukea kirjoittamista tasapuolisesti sekä kognitii- 
visena, kulttuurisena että sosiaalisena pääomana ja toimintana (Luukka 
2009). Samalla tulisi huomioida kirjoitustaidon kehityksen jatkumot ja 
kirjoitustaidon dynaaminen luonne eli esimerkiksi kirjoittamisen kyt- 
kökset kirjoittamismotivaatioon ja minäpystyvyyden kokemuksiin (Han- 
kala, Harjunen, Kauppinen, Kulju, Pentikäinen & Routarinne 2015). 
Tähän ohjaavat myös voimassa olevat Perusopetuksen opetussuunnitel- 
man perusteet (OPH 2014), joissa tuottamistaidot kytketään osaksi moni- 
lukutaitoa. 

Kirjoitustaidon opettajilta ja arvioijilta vaaditaan herkkyyttä havainnoi- 
da kirjoittamisen yksilöllisiä tarpeita ja taitoja eli esimerkiksi sitä, että 
tietyt kirjoittamisen sisällöt ja taidot eivät ole yhtä merkityksellisiä, ajan- 
kohtaisia tai tarpeellisia kaikille kirjoittajille. Kaikissa tilanteissa ei myös- 
kään tarvita samanlaista kirjoittamista. Kommunikatiivisen kirjoitus- 
taidon näkökulmasta kaikki kirjoittamisen tekstilajit ja funktiot eivät 
esimerkiksi edellytä yhtä suurta tarkkuutta, eikä kaikkia tekstejä tuoteta 
yksin tai tulkita pelkästään kirjallisen tuotoksen perusteella. 
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Johdanto 


Kielenkehitys alkaa puhutusta kielestä ja myöhemmän kielenkehityksen 
ja kirjoittamisen alkuvaiheissa juuri puhuttu kieli on lapsilla mallina. 
Neljävuotiailla suullinen kerronta on hyppelehtivää, mutta jo viisivuo- 
tiaat osaavat jäsentää kerrontaansa episodeihin ja seitsenvuotiaat voivat 
jo olla taitavia suullisen tarinan kertojia (ks. Nieminen 2007; Suvanto 
2012). Lapset kirjoittavat aluksi lyhyin ja yksinkertaisin lausein, jotka 
muistuttavat puhutun rakenteita ja kerrontaa. Osa 7-vuotiaista osaa 
myös kirjoittaa kertomusrakenteen mukaisesti, mutta vielä yhdeksän- 
vuotiailla kirjoittamisen mallina voi olla puhutun tapa tuottaa kerrontaa 
(ks. Strömgvist, Nordgvist & Wengelin 2004). Suurimmalla osalla kir- 
joittamistaidot kehittyvät hitaasti ja niiden kehittyessä sana-, lause- ja 
kertomustason rakenteet kompleksistuvat. Tutkimme tässä yhteydessä 
juuri tätä rakenteellista kompleksistumiskehitystä vertailemalla eri-ikäis- 
ten peruskoululaisten kirjoitelmia keskenään ja edelleen nuorten aikuis- 
ten kirjoitelmiin. Tavoitteena on selvittää sekä ikäluokkatasoinen että 
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kehityksellinen keskimääräinen osaaminen, jotta voidaan luoda ikään 
kuin kehityksellisiä mittareita, hahmottaa tavanomaisen osaamisen 
vaihteluvälejä. Tutkimusaineisto koostuu pääasiassa kertovaa tekstiä 
edustavista kirjoitelmista, jotka voivat olla rakenteeltaan paitsi hyvin 
yksinkertaisia ja yksitasoisia, myös monitasoisia, moniulotteisia ja mo- 
niäänisiä. Oletuksen mukaan keskimääräinen kehitys näkyy juuri raken- 
teen kompleksistumisena (vrt. Jagaiah, Olinghouse & Kearns 2020)."° 
Toinen oletus on, että lapset ja nuoret käyttävät kirjoitelmissaan niitä 
keinoja ja resursseja, jotka he hallitsevat, joten kirjoitelmien analyysin 
avulla saadaan tietoa kielenkehityksen vaiheesta. 

Kouluikäisten myöhemmän kielen kehitystä arvioidaan yleensä sana-, 
lauseke-, lause- ja tekstitason muuttujien avulla sekä lingvistisessä että 
psykolingvistisessä tutkimuksessa (ks. esimerkiksi Wolf Nelson & Van 
Meter 2007; Hall-Mills & Apel 2015; Price & Jackson 2015; Jagaiah ja 
muut 2020). Sanatason muuttujilla analysoidaan joko sanarakennetta 
tai sanastoa, lauseke- ja lausetasolla keskitytään sanaa ja lausetta laajem- 
piin yksiköihin, muun muassa niiden syntaktiseen koostumukseen. 
Tekstitasolla voidaan tutkia esimerkiksi kokonaissanamääriä ja käyttää 
erilaisia holistisia onnistuneisuusarvioita. Tekstitasolle kuuluvat myös 
tekstin rakenneosien analyysi, esimerkiksi kertomusrakenteen toteutu- 
minen, aloitusten ja lopetusten analyysi, moniäänisyyden ja evaluoinnin 
analyysi (ks. esimerkiksi Labov & Waletzky 1967; Bamberg 1997; Suvan- 
to 2012). Kehitystä voidaan arvioida myös sisällön ja koherenssin perus- 
teella (ks. esimerkiksi Habermas & de Silveira 2008). Sisällönanalyysi 
luokittelee temaattista sisältöä esimerkiksi suhteessa kuvattavana oleviin 
tapahtumiin. Tämä toimii etenkin silloin, kun on jokin oletus näistä 
tapahtumista ja niiden järjestyksestä kuten esimerkiksi elämäkerta- 
kertomuksissa tai kuvaelisitoinneissa (vrt. Tuurin Trajectoire-aineisto 
tässä teoksessa). Temporaalisen ja lokaalisen koherenssin analyysi kirjaa 
kehystämistä aikaan ja paikkaan, kausaalisen koherenssin analyysi syy- 
seuraussuhteiden esittämistä. Referentiaalista koherenssia tutkimalla 
selvitetään, miten tarkoitteet tuodaan tekstiin ja miten niihin viitataan 
(ks. Givön 2020; tässä teoksessa Kouvo ja muut). Globaalikoherenssia 


110 On syytä muistuttaa, että yksilötason kokonaiskehitystä ei voi arvioida yhden näytteen perusteella. 
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voidaan tutkia monesta näkökulmasta käyttämällä esimerkiksi T-yksikön 
rakenteen tai tekstijaksojen analyysiä. Tekstitypologiassa voidaan tarkas- 
tella esimerkiksi, miten kertova, kuvaileva tai argumentoiva teksti eroa- 
vat toisistaan. Eniten tiedetään kertovasta tekstistä, jonka analyysiin on 
valmiita välineitäkin (ks. Gillam & Pearson 2004; Schneider, Vis Dubé 
& Hayward 2005, Justice, Bowles, Kaderavek, Ukrainetz, Fisenberg & 
Gillam 2006; Graesser, McNamara & Kulikowich 2011). Tutkimustapa 
voi olla synkroninen, jolloin muutosta mitataan ikäluokkakohtaisia ana- 
lyysejä vertaamalla. Muutosta voidaan tutkia myös pitkittäistutkimuksella, 
jolloin seurataan samoja koehenkilöitä pidemmän aikaa (ks. esimerkiksi 
Honko 2013). Voidaan myös tutkia suunnittelu- ja kirjoittamisproses- 
sia (ks. esimerkiksi Strömgvist, Nordgvist & Wengelin 2004; Murto- 
rinne 2005). Peruskoululaisten myöhemmän kielenkehityksen hank- 
keessa on ollut käytössä monia tutkimustapoja. Tässä yhteydessä keski- 
tymme mikro- ja makrotason rakenneyksiköiden avulla rakenteelliseen 
kompleksistumiseen. 

Suomessa peruskoululaisten kieltä on tutkittu kehityksellisestä näkö- 
kulmasta yllättävän vähän. Alakoululaisten kirjoitelmia on tutkittu kehi- 
tyksellisesti jonkin verran (ks. esimerkiksi Matilainen 1989; Mäkihonko 
2006; Pajunen 2012; Honko 2013)" mutta vanhemmista koululaisista 
tehdyt tutkimukset ovat kysymyksen asettelultaan toisenlaisia eikä niissä 
arvioida rakennetta kehityksellisestä näkökulmasta eikä suhteuteta osaa- 
mista kielenkehitykseen (vrt. Murtorinne 2005; Ranta 2007; Juvonen, 
Kauppinen, Makkonen-Craig & Lehti-Eklund 2011; Harjunen, Marjanen 
& Karlsson 2019; toisin Leskinen, Savijärvi & Särkkä 1974 oppikoululai- 
sista). Oppimistutkimusta on tehty sekä ala- että yläkoululaisista, mutta 
kielenhallinnan tutkimus perustuu näissä holistisiin opettaja-arviointei- 
hin tai oikeinkirjoitukseen, ei kielen yksityiskohtaiseen analyysiin (ks. 
esimerkiksi Lappalainen 2003; 2008; Huisman 2006). Aikuistasoa saa- 
vutettavana tavoitetasona ei suomalaistutkimuksissa ole ollut mukana; 
aikuisten kielenhallinnan tutkimus on Suomesta ylipäätään puuttunut 


111 Kulju, Kauppinen, Hankala, Harjunen, Pentikäinen & Routarinne (2017) toteavat, että kirjoittamista 
on eniten tutkittu esikoulusta toiseen luokkaan mutta tutkimuksia on hyvin vähän vanhemmista 
peruskoululaisista. Aikuiskirjoittamisen tutkimus puuttuu myös heidän mukaansa kokonaan. 
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(ks. kuitenkin Petälä 2018). Aikuisten kielenkäyttöä tai kirjoittamista 
koskeva kansainvälinenkin tutkimus on vähäistä, verrataan heitä sitten 
nuorempiin tai tutkitaan omana ryhmänään (ks. esimerkiksi Berman & 
Verhoeven 2002; Nippold, Hesketh, Duthie & Mansfield 2005; Nippold, 
Mansfield & Billow 2007; Nippold, Cramond & Hayward-Mayhew 2014; 
Price & Jackson 2015); aikuistutkimus liittyy lisäksi usein muistin muu- 
tosten ja ikääntymisen vaikutukseen (ks. esimerkiksi Bromley 1991; 
Kemper, Marguis & Thompson 2001). Suomessa on ehkä eniten tutkittu 
kertomuksia mutta lähinnä poikkeavan kielenkehityksen näkökulmasta 
(esimerkiksi Suvanto 2012; Mäkinen, Loukusa, Laukkanen, Leinonen, 
Kunnari 2014; Mäkinen 2014; Heikkola 2017) mutta muiden tekstityyp- 
pien tuottamista vähemmän (ks. esimerkiksi Örnmark 2011). Myös 
useita tekstilajeja vertailevat tutkimukset puuttuvat. Psykometrisiin eli 
mitattaviin muuttujiin perustuvia tutkimuksia ei ole useita, vaikka täl- 
lainen testaus on vakio muualla länsimaissa (vrt. Jagaiah ja muut 2020). 
Mitattavien muuttujien avulla on helppo seurata paitsi oppimista myös 
arvojen hajontaa, variaatiota ja mahdollista muutosta. Suomessa puhu- 
taan nykyisin paljon kouluikäisten kielestä ja oppimistulosten muutok- 
sesta, mutta esimerkiksi laaja seurantatutkimus puuttuu kokonaan ja 
samoin tällaiseen tutkittuun tietoon perustuvat toimenpiteet. Luku- ja 
kirjoitustaidon kartoitustutkimuksia kyllä on tehty pitkään, mutta ne 
eivät mittaa kielenhallintaa. 

Kansainvälinen lasten ja nuorten kielenhallinnan ja kirjoittamisen 
tutkimus on laajaa, menetelmiltään vakiintunutta ja perustuu oleellisesti 
mittaamiseen. Lasten, nuorten ja nuorten aikuisten myöhempi kielenke- 
hitys -hankkeen motivaatio on ollut kattaa tutkimusaukkoa, joka koskee 
suomenkielisten peruskoululaisten kielenhallinnan koko kehityskaarta. 
Tässä luvussa tavoitteena on osoittaa muutamia kielenkehityksen kan- 
nalta keskeisiä — sanaan, lauseeseen ja tekstiin perustuvia — muuttujia 
(tarkemmin seuraava jakso), joiden perusteella voi arvioida paitsi kes- 
kimääräistä kehitystä myös sukupuolittain eriytyvää ja yksilöllistä ikä- 
kausittaista hallinnan variaatiota. Pääosin kyse on eri tason yksiköiden 
rakenteen monimuotoutumisesta ja toisaalta osaamisen hajonnan vähe- 
nemisestä iän mukaan. Aineistona on lähinnä kertovaa tekstiä edustavia 
kirjoitelmia, joita koehenkilöistä nuorimmatkin pystyvät ainakin peri- 
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aatteessa jo tuottamaan (vrt. Burns, de Villiers, Pearson & Champion 
2012). Kertomuksien analyysissä voi tukeutua mainittuihin narratiivisiin 
normeihin. Analyysi perustuu alakoululaisilta kerättyyn Koulukorpuk- 
seen ja Unelmakorpukseen, joiden kirjoittajat ovat peruskoululaisia tai 
kuudes- ja yhdeksäsluokkalaisia sekä nuoria aikuisia (ks. aineiston ja 
koehenkilöiden esittelyä tämän teoksen johdannosta). Unelmakorpuk- 
sen koehenkilöt ovat osallistuneet myös morfologiseen ja semanttiseen 
testaukseen (ks. Vainio, Pajunen & Häikiö 2019). 

Argumentaation kulku on seuraava: Ensimmäiseksi määritellään 
keskeinen käsitteistö ja esitellään aineisto ja koehenkilöt. Seuraavissa 
kolmessa luvussa esitellään tulokset, joiden avulla kuvataan paitsi kirjoi- 
telmien kehityksellisiä ja rakenteellisia ominaisuuksia myös pohditaan 
eroja kuvaavien muuttujien ominaisuuksia. Ensin käsitellään sanapi- 
tuus, sanarakenne ja kokonaissanamäärä, joilla yleensä operationalisoi- 
daan ikäluokkia erotteleva, iän tuoma kypsyys (maturity, ks. Wolf Nelson 
& Van Meter 2007; Olinghouse & Wilson 2013). Seuraavassa luvussa 
arvioidaan sanaluokkakoodaukseen perustuvia indeksejä, jotka laskevat 
muun muassa leksikaalisten ja kieliopillisten ainesten osuuksia. Vii- 
meinen analyysiluku keskittyy syntaktiseen kompleksisuuteen. Lopuksi 
kootaan keskeiset tulokset. 


Muuttujat ja aineisto 


Kehityksellinen näkökulma rakenteeseen edellyttää kielen yksiköiden 
kompleksistumisen tutkimusta. Kompleksisuus on asteittain kehittyvää 
ja sitä voidaan tutkia sekä horisontaalisella että vertikaalisella rakenne- 
tasolla. Edellinen liittyy esimerkiksi lauserakenteen monimuotoutumi- 
seen ja jälkimmäinen tarkastelee muutoksia vaikkapa lausekkeen hierar- 
kiassa. Määrittelemme seuraavaksi, mitä kompleksisuudella tarkoitetaan 
tässä tutkimuksessa ja millä aineistoin ja metodein tutkimus etenee. 


KEHITYSTÄ MITTAAVAT MUUTTUJAT KOMPLEKSISUUSASTEIKOLLA 
Keskeinen kielenkehityksen trendi on yksinkertaisesta kompleksisem- 


paan, on sitten kysymys sanastosta tai rakenteesta, puhumisesta tai kir- 
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joittamisesta. Yksinkertaisuus vaihtelee luonnollisesti arvioitavan kielen- 
yksikön mukaan, ja se on helpoin määritellä negatiivisesti. Esimerkiksi 
Givönin (2009, 3-7; 2020, 56-58) mukaan kompleksisuus on organisoi- 
dun systeemin ominaisuus, yksinkertaisesta puuttuu järjestyneisyys. 
Tässä yhteydessä tukeudumme toisaalta kieliopilliseen merkintään, jon- 
ka avulla verkoston järjestäytyneiden jäsenten suhteita voidaan ilmaista 
(ks. Itkonen, Pajunen & Suomi 2009; Pajunen 2010) ja toisaalta yleisyy- 
teen. Kielen yksiköt, joita tutkimme, sijoittuvat joko horisontaaliselle tai 
vertikaaliselle tasolle, so. toisaalta sanat, lausekkeet ja lauseet ja toisaalta 
näiden tekstiin peräkkäin sijoittuvien yksiköiden sisäinen hierarkkinen 
rakenne. Johtamaton sana ja vain välttämättömistä jäsenistään koostuva 
lauseke ovat yksinkertaisia yksikköjä: niistä ei voi enää ottaa mitään pois 
kokonaisuuden muuttumatta. Tämä pätee sekä paradigmaattisesta että 
syntagmattisesta lausekkeesta. Johdetut sanat ja yhdyssanat, määritteitä 
sisältävät NP:t ja useammasta osasta ja/tai sidonnaisesta morfeemista 
koostuvat finiittimuodot ovat kompleksisia. Yleisimmät sanat ovat 
useimmiten rakenteeltaan yksinkertaisia ja leksikaalisen hierarkian 
yleistason sanoja, merkitykseltään usein hyvin konkreettisia. Konteks- 
tissa ne ovat suhteellisen vähän taivutettuja (eli toimivat esimerkiksi 
subjektina tai objektina). Rakenteellinen kompleksisuusasteikko on toi- 
sin sanoen laaja: sekä sana-, lauseke- ja lausetason yksikköjä että näitä 
laajempia rakenteellisia kokonaisuuksia voidaan tarkastella asteikolla 
yksinkertainen-kompleksinen. Kompleksisten yksikköjen kehityksel- 
linen merkitsevyys on osoitettu usean kielen analyyseistä (ks. esimer- 
kiksi Bromley 1991; Berman & Verhoeven 2002; Berman 2004; 2007; 
Nippold 2006; Nieminen 2007; Jagaiah ja muut 2020). Myös toisen 
tai vieraan kielen oppimisessa kompleksistuminen on varteenotettava 
tekijä mutta analyysi edellyttää aina lähde- ja kohdekielen rakenteiden 
vertailua, jos vertailulla ennustetaan esimerkiksi L2-kielen oppimista 
(ks. esimerkiksi Kaivapalu 2005). Aina ei näet ole ilmeistä, mitkä yksiköt 
vertautuvat toisiinsa eri kielissä (vrt. Vainio, Pajunen & Hyönä 2014; 
2016). On vielä huomattava, että vaikka rakenteellinen kompleksistu- 
minen on kehityksellistä, sen yhteys kirjoittamisen tasoon on huonosti 
tunnettu ja tutkimustulokset vaihtelevat (vrt. Beers & Nagy 2009, 186; 
Jagaiah ja muut 2020). Tasoa yleensä mittaavat holistiset arviot eivät 
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yksinään hevin voikaan toimia kehityksellisinä ja määriteltävinä mitta- 
reina. Eri arvioijien näkemyserot tekstin laadusta voivat myös olla suuret 
(Boewer, Béguin, Sanders & van den Bergh 2015). 

Rajaamme kompleksistumisen tutkimisen tässä luvussa toisaalta sa- 
natason, toisaalta lausetason yksiköihin. Rakenteellista kompleksistu- 
mista on Koulu- ja Unelmakorpuksen aineistoilla — siis samalla tavoin 
koodatusta aineistosta — tarkasteltu myös monessa opinnäytteessä. Esi- 
merkiksi Mäkelä (2012) käsittelee NP:n kompleksistumiskehitystä eli 
hierarkkistumista, Nahkola (2012) yhdyslauseiden kehitystä, Oinonen 
(2008), Elomäki (2011), Salmenoja (2013) ja Rainoja (2014) yleisimmin 
rakenteellista kehitystä. S2-näkökulma on Hongolla (2013) ja Viljasella 
(2012). Haapalan (2008) pro gradu -tutkielmassa osoitettiin yleisen kieli- 
kokeen aineistolla verbilausekkeen predikaattiosan odotuksen mukainen 
kompleksistuminen taitotasoasteikoittain; vastaava kehitys on näkyvissä 
alakoululaisten kirjoitelmista (Keskinen 2012; Pajunen 2012). Teks- 
tin rakenneosia ovat tutkineet muun muassa Sintonen (2011) ja Vesala 
(2012). 

Tekstisanojen pituus ja niiden vähittäinen pidentyminen mittaa suo- 
men kaltaisessa synteettisessä kielessä sekä sanojen taivutuksen että 
johdosten ja yhdyssanojen määrää. Suomen johtamattomien sanojen 
merkkimäärä — sanapituus — vaihtelee tyypillisimmin 3-7, vaikka yksit- 
täisiä kahden tai yli seitsemän merkin mittaisia johtamattomia sanoja 
löytyy. Keskimääräisen sanapituuden kasvu toimii suomen kielessä yk- 
sinkertaisena kehityksellisenä mittarina (ks. Pajunen 2012; Honko 2013), 
koska lyhyet sanat ilmaisevat tyypillisesti perustason merkityksiä (esi- 
merkiksi juosta ja kaatua) ja pitkät sanat spesifisempiä ja täsmällisempiä 
merkityksiä (esimerkiksi juoksennella ja kompastua) ja koska edellisten 
väheneminen ja jälkimmäisten lisääntyminen käy iän mukaan. Sanapi- 
tuus korreloi tyypillisesti monen sisällöllisen muuttujan kanssa, kuten 
käytettyjen sanojen harvinaisuus, diversiteetti, leksikaalinen tiheys ja 
leksikaalinen spesifisyys (ks. esimerkiksi Malvern, Richards, Chipere 
& Durän 2008, 157; ks. myös Pajusen & Hongon analyysiä Unelma- 
sanastosta tässä teoksessa). Kuvausta voi tarkentaa sanarakenteen ana- 
lyysin avulla jakamalla aineiston sanat johtamattomiin, johdettuihin, 
yhdyssanoihin sekä esimerkiksi symboleihin ja sanaliittoihin. Sanatason 
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muuttujiin kuuluvat myös sanaluokat, joihin tyypillisesti perustuvat eri- 
laiset tekstin ominaisuuksia mittaavat indeksit. 

Sanaluokkaindeksejä on useanlaisia, ja niiden avulla voidaan antaa 
esimerkiksi tekstilajikohtaisia tekstin tyyppiarvoja, laskea tekstin infor- 
matiivisuutta ja tutkia jonkin tarkkaan valitun ilmiön esiintyvyyttä (ks. 
esimerkiksi Read 2000; Berman, Nayditz & Ravid 2011; Price & Jackson 
2015, 283). Niillä arvioidaan muun muassa leksikaalista tiheyttä eli leksi- 
kaalisten sanojen osuutta kokonaissanamäärästä (ks. O’Loughlin 1995). 
Niillä voidaan arvioida myös substantiivimäärän suhdetta verbimäärään 
(noun-to-verb ratio, ks. esimerkiksi Biber, Conrad & Reppen 1998) ja 
edelleen substantiivitiheyttä, joka vaihtelee tekstityypin mukaan. Toi- 
saalta indeksit mittaavat informaatiotiiviyttä, leksikaalista rikkautta. Toi- 
saalta indekseillä voi arvioida tekstin rakenteen luonnetta, esimerkiksi 
korkea finiittiverbipitoisuus viittaa rakenteellisesti yksinkertaiseen ja 
peruslauseilla etenevään tekstiin."? 

Sanaluokkaindeksit edellyttävät luonnollisesti aineiston yksityiskoh- 
taista ja yhtenäistä sanaluokitusta. Koko Unelma-aineisto on sanaluoki- 
teltu ensin perussanaluokkiin (substantiivit, verbit, adjektiivit, adverbit, 
numeraalit, pronominit, konjunktiot ja interjektiot) ja edelleen alaluok- 
kiin (muun muassa appellatiivit ja proprit, finiittiset ja ei-finiittiset ver- 
bimuodot). Lisäksi sanoja on analysoitu funktionaalisesti ja semantti- 
sesti. Erityisen tarkkoja on oltu rajailmiöiden yhtenäisestä analyysista. 
Esimerkiksi substantiiviparadigmasta irtautuneet adverbit on koodattu 
systemaattisesti samalla tavoin ja koodaus on tarkistettu arvioijareliabili- 
teettia laskemalla. Unelma-aineistosta on tehty sanaluokka-analyyseja 
runsaasti myös opinnäytetöissä (ks. esimerkiksi Kuisma 2011 adjektii- 
vien käytöstä; Keskinen 2012 modaaliverbeistä; Koivunen 2012 adver- 
beista; Nahkola 2012 konjunktioista; Palonen 2013 pronomineista). Ta- 
voitteena on toisaalta osoittaa näiden muuttujien avulla tavanomaista 
kehitystä ja ikäluokkakohtaista variaatiota. Toisaalta pyrimme osoitta- 
maan kertovan tekstin ikäluokkakohtaisia ja yleisiä tyyppiarvoja, joissa 
hajonta vähenee kehityksellisesti. 


112 Peruslauseella tarkoitetaan lausetta, joka kiistattomasti sisältää vain yhden predikaation (ks. Itkonen 
2010, 203). Kyse voi olla intransitiivisesta tai transitiivisesta verbilauseesta tai olla-verbin kanssa 
järjestyvästä kopulalauseesta. 
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Käsittelemme tässä yhteydessä rakenteellista kompleksisuutta sanata- 
son lisäksi myös lauserakennetta tutkimalla. Lauserakennetta analysoi- 
daan niin sanottujen T-yksiköiden avulla (ks. Schneider ja muut 2005). 
T-yksikkö koostuu päälauseesta ja siihen liittyvistä finiittisistä ja ei-finiit- 
tisistä aineksista, jotka on selvästi merkitty alisteisiksi käyttämällä alis- 
teisia elementtejä (komplementtilauseet, relatiivilauseet sekä konjunk- 
tioilla koska, kun, vaikka jne. alkavat adverbiaalilauseet), infinitiivejä tai 
lauseenvastikkeita (temporaali-, partisiippi- ja modaalirakenteet). Myös 
lausemuotoiset suorat ja epäsuorat lainaukset on laskettu alisteisiksi. 
Sen sijaan minen-johdoksia ja lausesubjektiin tai -objektiin teemasuh- 
teessa olevia partisiippeja (esimerkiksi lapsi istui kyynelehtivänä) ei ole 
huomioitu alisteisina rakenteina, koska niiden yhteydessä on runsaasti 
tulkinnallisia tapauksia; tosin kumpikin ryhmä kasvaa kehityksellisesti. 
minen-johdoksia ja ei-finiittisiä aineksia arvioidaan kompleksisuuden te- 
kijöitä analysoitaessa (ks. tämän teoksen loppuluku). T-yksikön laskenta- 
tapa pohjautuu semanttiseen tasoon eli propositioihin™, jotka siis ra- 
kenteen tasolla on koodattu joko päälauseeksi tai alisteiseksi ainekseksi. 
Kun jaottelu keskeiseen ja taustoittavaan ainekseen on kirjoittajan, tulos 
heijastaa hänen näkemystään ja tapaansa tiivistää sanottavaa. T-yksiköistä 
lasketaan koehenkilökohtaisesti niin keskimääräinen sanamäärä (= mean 
lenght of terminal units eli MLTU) kuin kompleksisuusindeksi (CI eli alis- 
teisten yksikköjen suhde T-yksilöiden kokonaismäärään). MLTU ja CI 
ovat keskeisimpiä kehityksellisistä mittareista ja kaikkein yleisimmin käy- 
tettyjä (Jagaiah ja muut 2020); edellinen ilmaisee horisontaalisen tason 
kielenyksikköjen määrän ja jälkimmäinen vertikaalisen tason hierark- 
kisuutta. Näiden mittareiden avulla pyrimme selvittämään kirjoitelmien 
syntaktisen tiiviyden (syntactic density), jonka tiedetään nousevan kehi- 
tyksellisesti (ks. Nippold ja muut 2005; 2007; Berman 2007; Beers & 
Nagy 2009; 2011; suomesta ks. Petälä 2018; Muhonen 2019; Tiiro 2021). 

Keskitymme tässä luvussa toisaalta rakenteellisiin muuttujiin, kuten 
sanapituus, sanarakenne ja erityyppinen rakenteellinen kompleksisuus, 
toisaalta sanaluokkien avulla laskettaviin indekseihin, joilla voidaan tar- 


113 T-yksikköjen määrittely perustuu siis semanttiseen tasoon ja siksi analyysissä on irrelevanttia se, 
miten yksittäisissä kieliopeissa propositioiden reaalistumia luokitellaan. 
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kentaa lausetason muuttujien antamaa kuvaa tekstin luonteesta. Sanas- 
tomuuttujia ja kompleksisuustekijöitä käsitellään tässä teoksessa myös 
erikseen. Sukupuoli on muuttujana mukana tässäkin luvussa. Muuttujia 
käsitellään keskiarvolukujen, jakaumien ja niiden hajonnan vähenemi- 
sen kannalta sekä yleisyysluokitettuina. Todettakoon jo tässä vaiheessa, 
että ikäryhmittäinen hajonta tyypillisesti kapenee iän myötä mutta ei hä- 
viä kokonaan. Oletus luonnollisesti on, että koulutuksen pitäisi vähentää 
hajontaa oleellisesti jo peruskouluvaiheessa (vrt. esimerkiksi Hadley & 
Ripoli 2012; Truckenmiller & Petscher 2020). 


AINEISTO JA TUTKIMUSMENETELMÄT 

Aineistona on sekä Koulu- että Unelmakorpuksen kirjoitelmat (ks. tämän 
teoksen johdantoa), jotka on kirjoitettu samasta aiheesta eli unelmieni 
päivästä samalla tehtävänannolla: kirjoita unelmiesi päivästä, jonka olet 
kokenut, haluaisit kokea tai voisit kokea maailmassa, missä mikä tahan- 
sa olisi mahdollista (ks. Pajunen 2012). Koulukorpuksen kirjoittajat ovat 
alakoulun luokilta 1-6. Tästä aineistosta ei ole laskettu kaikkia vertailu- 
lukuja, koska osa nuorimpien teksteistä on laskelmiin liian lyhyitä, jopa 
yksisanaisia. Unelmakorpuksen kirjoittajat ovat kuudesluokkalaisia ja 
yläkoululaisia sekä nuoria aikuisia. Koulukorpuksen kuudennen luo- 
kan aineisto on kirjoitettu kahdeksan vuotta aikaisemmin kuin Unel- 
makorpuksen kuudennen aineisto, ja tämä aikaero mahdollistaa jo kuu- 
densien vertailua. Peruskoululaisten aineistoja vertaillaan nuorilta aikui- 
silta kerättyihin aineistoihin, jotka koostuvat toisaalta ammattikorkea- 
koululaisten sukupuolen mukaan vertaistetusta aineistosta ja toisaalta 
suomen kielen pääsykoeaineistosta, jossa naisten osuus kirjoittajista on 
runsaat 80 prosenttia. Kirjoittajia on yhteensä lähes 1900 ja heitä on 
joka ikäluokasta vähintään noin sata. 

Peruskoululaisten aineistoista lasketaan yleisiä tunnuslukuja vuosi- 
luokittain tai ryhmittäin mutta osasta aineistoa on tehty tarkempia ana- 
lyysejä, joihin pyrimme saamaan sukupuolittain satakunta koehenkilöä 
joka ryhmästä, mikä olisi edustava alaryhmäkoko myös jakaumien kan- 
nalta (ks. Nippold ja muut 2005, 1059); se ei täysin kaikissa ryhmissä 
onnistu. Osasta aineistoa on myös erilaisia kielellisiä tai muita vertailu- 
lukuja. Kuudes- ja yhdeksäsluokkalaiset sekä ammattikorkeakoululaiset 
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ovat osallistuneet elektronisiin sanaston hallintaa mittaaviin testeihin ja 
suomen kielen pääsykokeeseen osallistuneista on tietoa paitsi kieliopin 
ja kielenkäytön pääsykoeosioista myös ylioppilastutkinnon arvosanoista 
sekä sanastosta (ks. tarkemmin tämän teoksen johdanto). Aineistosta on 
koostettu myös koehenkilökohtainen taulukko, johon on koottu kaikki 
eri muuttujista lasketut arvot ja kaikki yhdestä koehenkilöstä saatavilla 
ollut tieto. Aineistoa analysoidaan laadullisesti, määrällisesti ja tilastolli- 
sesti. Tavoitteena on tässä yhteydessä antaa aineistosta yleiskuva, ja 
painopiste on kielellisen rakenteen kehityksellisessä muutoksessa. Ta- 
voitteena on myös ryhmänsisäisen hajonnan esiin nostaminen. Tässä 
yhteydessä emme käsittele sanastoa, kirjoittamistavan muutoksia, kerto- 
musskeemaa tai sisällöllisiä tekijöitä vaan keskitymme juuri laskettaviin 
rakennekeskeisiin muuttujiin. Laadullisempi ote on monissa muissa 
aineistoon perustuvissa tutkimuksissa. Vertaamme joitain tuloksia myös 
sanomalehtikielen vastaaviin. Ne on laskettu Savon Sanomien korpuk- 
sen (Pajunen & Virtanen 2002) miljoonan tekstisanan otoksesta ja nii- 
den on tarkoitus havainnollistaa tekstityyppi- ja lajieroa. 


Kypsyys 


Kypsyys eli kirjoitetun kielen konventioiden karttuva hallinta on helpoin 
operationalisoida pintafrekvenssien avulla. Pintafrekvensseillä lasketaan 
melko helposti tavoitettavia, koko tekstimassaa koskevia yksikköjä, joi- 
den määrä tyypillisesti kasvaa iän mukana tiettyyn oletustasoon. Mata- 
lat arvot liittyvät yleensä kehittyvään kieleen, korkeat arvot kuvaavat 
kompleksisempaa kieltä (ks. esimerkiksi Olinghouse & Wilson 2013). 
Pintafrekvenssien paljastama muutos on osin oireellinen, koska niihin 
vaikuttaa voimakkaasti kirjoitelman onnistuneisuus, kirjoittajan moti- 
vaatio ja toisaalta kokonaissanamäärä sekä luonnollisesti aihe ja teksti- 
tyyppi tai -laji (Pajunen 2012; Kyösti 2018). Tekstin pituus vaikuttaa eri- 
tyisesti leksikaalisiin indekseihin kuten diversiteettiarvoihin (vrt. esi- 
merkiksi McCarthy & Jarvis 2007; Jarvis 2013). Omassa aineistossamme 
hyvin lyhyet kirjoitelmat vinouttavat pintafrekvenssejä ja tästä syystä me- 
diaani tai aineiston uudelleen analysointi yleisyysluokittain antaa ikä- 
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luokasta paremman kuvan kuin esimerkiksi keskiarvo. Aineiston tilas- 
tollisesta analyysista kaikkien lyhimmät kirjoitelmat (eli alle 50 sanaa) 
jätetään poikkeavina arvoina pois, jotta yleiskuva ei vääristyisi. Pinta- 
frekvensseistä painotamme sanapituuden kasvua sekä keskimääräisen 
iän mukaan että sukupuolittain tarkasteltuina. Toiseksi tarkastelemme 
sanarakennemuutoksia ja kiinnitämme huomiota erityisesti johdosten 
käytön lisääntymiseen. Nämä kaksi ensimmäistä muuttujaa mittaavat 
leksikaalista kompleksistumista (Strömqvist, Johansson, Kriz, Ragnars- 
döttir, Aisenman & Ravid 2002). Lisäksi tarkastelemme kokonaissana- 
määriä. Sanamäärä on lähinnä nuorimmilla kirjoittajilla kehityksellinen 
yksikkö, vanhemmilla kirjoittajilla on jo yksilöllistä taipumusta tiiviiseen 
tai laveaan kerrontaan. Pintafrekvenssien antamaa kuvaa pyrimme tar- 
kentamaan muilla muuttujilla. 


SANAPITUUS 

Tekstisanojen sanapituuden vaihtelu liittyy käytetyn sanaston laatuun 
ja taivutuksen määrään: Mitä enemmän käytetään kielen kaikkein ylei- 
simpiä sanoja, sitä lyhyempiä sanat keskimäärin ovat. Mitä pidemmät 
sanat ovat kirjoittajilla käytössä, sitä kompleksisempia ne rakenteeltaan 
suomen tapaisessa kielessä ovat. Kompleksiset sanat ovat sekä johdoksia 
että yhdyssanoja ja lisäksi enemmän taivutettuja kuin yksinkertaisem- 
mat sanat. Näitä tekijöitä ei voi erotella pelkän sanapituus-muuttujan 
avulla. Oletus luonnollisesti on, että nuorimmat kirjoittajat käyttävät 
kaikkein lyhyimpiä sanoja. Sanapituudet on laskettu varovasti yleiskie- 
listetyistä sanoista, jolloin esimerkiksi kirjoitusvirheet, puheenomainen 
loppuheitto tai yhdyssanavirheet eivät vaikuta tuloksiin (ks. taulukko 
49). Aineiston kokonaissanamäärä on yli 230 000. 


Taulukko 49. Tekstisanapituudet (= kirjainmerkkimäärä) Unelmakirjoitelmissa. 


Ikäluokka / Tunnusluvut Keskiarvo Mediaani Keskihajonta 
Alakoulu 1.-5. 6,0 6 2,9 
Alakoulu 6. 6,28 6 2,5 
Yläkoulu 7.-8. 6,48 6 3,3 
Yläkoulu 9. 6,59 6 3,2 
Aikuiset, pääsykoe 6,99 7 3,3 
Aikuiset, AMK 7,02 7 3,4 
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Tekstisanapituudet kasvavat kirjoitelmissa tasaisesti ikäluokasta ja luokka- 
asteesta toiseen. Nuorimpien ja vanhimpien kirjoittajien välillä ero keski- 
arvoissa on yksi merkki. Se ei vaikuta suurelta mutta on merkitykselli- 
nen, koska taivutus usein lisää sanapituutta juuri yhdellä merkillä (vrt. 
esimerkiksi genetiivi -n; partitiivi -a) ja koska johtamisen yhteydessä 
johtimen pituus vaihtelee yleensä 1-3 merkkiin. Toisin sanoen aikuis- 
kirjoittajilla sanoissa on joko keskimäärin enemmän taivutusta tai sa- 
narakenne on kompleksisempi. Sanapituuden mediaani on kaikilla 
peruskoululaisilla kuusi merkkiä ja aikuiskirjoittajilla seitsemän. Aikuis- 
kirjoittajilla mediaani on sama kuin Savon Sanomien korpuksessa 
mutta sanomalehtikielessä sekä keskiarvo (7,8) että keskihajonta (4) 
ovat korkeampia. Keskeinen syy eroihin lienee toinen tekstityyppi tai 
-laji. Unelmakirjoitelmissa myös sanapituuden vaihtelu (keskihajonta) 
lisääntyy iän mukaan mutta ei yhtä suoraan kuin sanapituudet. Lek- 
seemipituudet ovat ikäryhmittäin tyypillisesti yhtä merkkiä lyhyemmät 
(5.19—5.89). 

Sukupuolen mukaan tarkasteltuna alakoulun luokkien 1.-5. pojat 
käyttävät keskimäärin aavistuksen pidempiä tekstisanoja kuin tytöt. Ty- 
töillä vaihteluväli on iän mukaan 5,9-G,9 ja pojilla 6,1-7,1. Ero kääntyy 
kuudennella luokalla tyttöjen hyväksi ja selittyy siten, että kaikkein nuo- 
rimmat pojat kirjoittavat paljon tyttöjä vähemmän ja usein substantii- 
veja luettelemalla. Toisin sanoen poikien aineistossa kieliopilliset — eli 
lyhyet — sanat ovat vähissä (ks. Pajunen 2012). Toisaalta ero kääntyy taas 
aikuisiässä miespuolisten hyväksi. Tämä liittynee miesten kompleksi- 
sempaan kirjoittamistapaan, joka tulee monen muuttujan kautta esille. 
Mediaanit ovat koko aineistossa ja sukupuolen mukaan erotellen samat, 
mutta poikien sanapituuksissa on enemmän hajontaa kuin tyttöjen. 

Sanapituuden keskiarvo on laskettu myös koehenkilökohtaisesti ja- 
kamalla kuudennen, yhdeksännen ja aikuisten kirjoittamien sanojen 
merkkimäärä kirjoitelman sanamäärällä ja luokittelemalla aineisto saa- 
dun luvun mukaan keskimäärin alle viisimerkkisiin ja puoli merkkiä 


114 Lauseopin arkiston 1970-luvun sanomalehtikielen sanapituuden keskiarvo oli 7,4-7,9 (ks. Pajunen & 
Palomäki 1984, 70-71), joten sanomalehtikielessä ei ole tapahtunut sanottavaa muutosta 30 vuoteen. 
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kerrallaan aina yli kahdeksanmerkkisiin (ks. taulukko 50). Näin saadaan 
hajonta näkyviin. Ryhmien sisäiset erot ovat suuremmat kuin ryhmien 
väliset mutta valtaosin hajonta keskittyy peruskoululaisilla välille 5,5-6,5 
ja aikuisilla 6,5—7,5. Nämä ovat ikään kuin iänmukaisia tyypillisiä arvoja 
kertovassa tekstissä. Ääriarvot, jotka sijoittuvat alle 5,5 tai yli 7,5 ovat 
selvästi poikkeavia; niiden prosenttiosuus on tässä muuttujassa odotuk- 
senmukainen (toisin sanoen 2-3 %). 


Taulukko 50. Sanapituuksien keskiarvon mukainen jakauma. 


Tkäluokka / Alle 5 5 55 6 6,5 7 7,5 8 tai 
Sanapituusluokat % merkkiä enemmän 
Kuudes 0,6 2,9 18,8 39,6 23 9,6 4,1 1,3 
Yhdeksäs 0,0 0,6 11,9 28,7 36,2 16,2 5,6 0,8 
Aikuiset 1,2 13 40,3 311 12,5 1,8 


Sanapituuksien vaihtelu liittynee tekstintuottamisen erilaisiin strategioi- 
hin ja toisaalta kehityseroihin. Tämä näkyy muun muassa sanapituus- 
keskiarvojen ja leksikaalisen indeksin korrelaatiosta: mitä pidemmät 
sanat kirjoitelmassa, sitä enemmän leksikaalisia sanoja. Lisäksi tuotta- 
misongelmat ja motivaatio vaikuttavat myös sanapituuksiin. Esimerkiksi 
Kyöstin (2018) tutkimuksen kuudesluokkalaisilla sanapituuskeskiarvot 
vastasivat suunnilleen tämän tutkimuksen lukuja, mutta toisen kirjoitus- 
kerran motivaation nostattaminen nosti tyttöjen sanapituuksia ja laski 
poikien. Ääriarvoja saaneet tekstit ovat muilta ominaisuuksiltaan vaihte- 
levampia kuin lähellä ikäkeskiarvoa olevat. Esimerkiksi hyvin lyhyt teksti 
voi saada sekä matalan että korkean sanapituuskeskiarvon, joten pelkkä 
koehenkilön sanapituuskeskiarvo ei vielä kerro kaikkea. Lyhytsanaiset 
tekstit voivat olla puhekielisiä ja kertovia, pitkäsanaisissa leksikaalinen 
tiheys eli leksikaalisten sanaluokkien yhteismäärä voi olla korkea, mutta 
teksti sinällään ei välttämättä ole kummassakaan tyypissä tasokas. 
Esimerkkeihin 1-3 on valittu näyte kunkin ikäluokan lyhytsanaisesta 
tekstistä. Näytteet ovat kaikki naispuolisten kirjoittamia ja edustavat 
vertailtavuuden vuoksi hieman samantapaista tyyliä (mutta eivät onnis- 
tumisastetta): iän tuoma muutos näkyy sanapituuksissa selvästi. Kuu- 
dennen ja yhdeksännen luokan näytteet vaikuttavat puhekielisiltä ja 
suunnittelemattomilta, aikuisnäyte on kuvailevaa kerrontaa. Usein 
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puheenomaisessa, rakenteellisesti latteassa kerronnassa on naiskirjoit- 
tajilla lyhyitä sanoja. Mieskirjoittajilla ääripituudet johtuvat usein kir- 
joittamisongelmista: vähän tekstiä, substantiiviluetteloa ja niin edelleen. 
Kun sitten sanojen keskipituus nousee, se näkyy monissa tekstin omi- 
naisuuksissa, muun muassa sekä leksikaalisessa että syntaktisessa ti- 
heydessä. Vaikutelma siis on se, että ikäluokittain keskisanapituuksissa 
olevat tekstit ovat ominaisuuksiltaan neutraaleimpia ja ehkä ikätason 
osaamista parhaiten kuvaavia. Tätä oletusta voi tarkastella muiden 
muuttujien analyysin avulla. 


Kuudes luokka (sanapituuden keskiarvo 5): 

1) Olipa kerran Tyttö, joka oli aina haaveillut omaa hevosta. Mutta 
hän ei saanut sitä kun he olivat hyvin hyvin köyhiä. Niillä ei ees mel- 
keen riittäneet ruokaakaan rahaa. (6F50)'5 


Yhdeksäs luokka (ka 5,6): 

2) Pyysin äitini hakemaan minut harkoista. Sitten hän tuli ja sanoi 
että lähdemme Suoniemelle katsomaan koiraa. Lähdimme ajamaan 
kohti Suoniemeä. Sitten saavuimme sinne missä koirat on. (9F23) 


Aikuiset (ka 6,2): 

3) Tunnen herääväni. Tunnen, kuinka aurinko on jo lämmittänyt osan 
yön kasteesta sen nousten nyt sumuverhoina peittämään vielä unessa 
olevia kasveja. Avaan silmäni ja olo on virkeä ja terve. (AikF89) 


SANARAKENNE 

Sanarakenteen perusteella sanasto voidaan jakaa yksi- ja monimorfeemi- 
siin ja jaolla voidaan arvioida ilmaisujen granulariteettia eli spesifisyys- 
astetta. Oletus on, että yksimorfeemisten sanojen tarkkuus on matalam- 
pi kuin monimorfeemisten (Strömgvist ja muut 2002). Merkitykseltään 


115 Esimerkkinäytteissä ensimmäinen numero/osio viittaa luokka-asteeseen, ikäluokkaan tai ryhmään, 
toinen (F/M) kertoo sukupuolen ja kolmas ilmaisee kirjoitelman järjestysnumeron luokan mukaan 
numeroituna. Aikuisryhmään viitataan lyhenteellä Aik ja alaryhminä AMK viittaa ammattikorkeakoulu- 
laisten aineistoon, Pääsy taas suomen kielen pääsykokeeseen osallistuneilta kerättyyn aineistoon. 
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rajatumpia eli tarkempia voidaan käyttää harvemmissa konteksteissa 
kuin merkitykseltään rajaamattomampia, mutta rajaamattomampi mer- 
kitys jättää enemmän tulkinnanvaraa kuin rajattu. Sanan johtamatto- 
muus, lyhyys ja yleisyys ovat erityisesti koululaissanastoa kuvaavia omi- 
naisuuksia. Esimerkiksi lehtikorpusten ja koululaissanaston yleisissä 
verbeissä on johtamattomia verbejä kuten ajaa, maata ja syödä. Har- 
vinaisempien verbien joukossa on johdoksia kuten ajella ja mussutella, 
aikuissanastossa myös lekotella. Verbi syödä ilmaisee ravinnon nauttimi- 
sen, mussutella lisäksi syömistavan ja -keston. Oletus on myös, että mo- 
nimorfeemisuus — leksikaalinen kompleksisuus — nousee kehityksel- 
lisesti. Erityisesti johdettujen sanojen katsotaan olevan tärkeitä lasten 
ja nuorten myöhemmässä kielenkehityksessä (ks. esimerkiksi Carlisle 
2000; Kirby, Deacon, Bowers, Izenberg, Wade-Woolley & Parrila 2012; 
Truckenmiller & Petscher 2020, 61-62). Kielissä, joissa sananjohto on 
monimutkaista (vrt. Lieber & Stekauer 2014), johdosten oppiminen on 
erityisen hidasta ja siten kehityksellisesti sitäkin merkitsevämpää. Suo- 
messa ja esimerkiksi hepreassa sananjohtoa opetellaan vielä nuoruus- 
iällä ja aikuisenakin (ks. Ravid 1998; Vainio, Pajunen & Häikiö 2019; 
Pajunen & Itkonen 2019). Englannin tapaisessa kielessä, jossa sanoja 
johdetaan suomeen verrattuna vähän, sananjohto hallitaan toisella kym- 
menellä (Nippold & Sun 2008). Suomen verbiderivaatiolla tuotetaan 
paitsi spesifejä merkityksiä myös muunnellaan lauserakennetta. Nämä 
muunnokset edellyttävät kykyä nähdä tapahtumia milloin tekijän mil- 
loin vaikkapa kohteen, kokijan tai lähteen näkökulmasta ja vaikuttavat 
tekstin koherenssin luomiseen. 

Unelmakirjoitelmien aineisto on koodattu sanarakenteen mukaan 
luokkiin johtamattomat, johdetut ja kiteytyneet sanat sekä yhdyssanat 
ja muut. Johtamattomien ja johdettujen sanojen erottelu perustuu läpi- 
näkyvyyden periaatteelle ja pyrkii noudattamaan valistuneen maallikon 
tietämystä sanarakenteesta. Analyysi ei siis ole kielihistoriallista mutta ei 
myöskään perustu oletuksiin lasten johdostuntemuksesta. Useimmiten 
yksi- tai kaksitavuinen sana on johtamaton, mutta myös kolmitavuiset 
supistumavartaloiset verbit (hakata, loukata) on luettu johtamattomiin, 
samoin -ea-loppuiset adjektiivit. Johdos tarkoittaa siis pääasiassa kak- 
sitavuista pidempää sanaa, jossa johdin on aika tavallisen tuntuinen, 
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helposti segmentoitavissa ja ainakin periaatteessa vielä produktiivinen. 
Yhdyssana on kahdesta tai useammasta johtamattomasta tai johdetusta 
sananosasta koostuva sana. Yhdyssanat on laskettu kirjoitusasultaan 
yleiskielistettyinä, joten määriin ei vaikuta oikeinkirjoituksen hallitse- 
mattomuus (vrt. Hongon analyysi tässä teoksessa). Kiteytyneisiin sa- 
noihin kuuluu sijataivutuksen pudokkaita, joilla nykykielen kannalta ei 
yleensä ole selvää kantasanaa. Luokassa on runsaasti pronominaalien 
paikallissijamuotoja (siellä, täällä) ja yleensä sanoja, jotka taivutettuina 
ovat adverbeja, eivät kantasanansa mukaisesti esimerkiksi substantii- 
veja. Luokkaan muut kuuluu sanaliittoja (kuten kirjojen, elokuvien ja 
pelien nimiä), symboleja (esimerkiksi $, @) ja vierassanoja (esimerkiksi 
englanninkieliset sanat). Sanarakenteen analyysin avulla voidaan tarken- 
taa sanapituuksien vertailua. Sanarakenneanalyysi näyttää rakenteelli- 
sesti yksinkertaisten ja monimutkaisten sanojen määrän tarkasti mutta 
ei anna tietoa taivutuksen määrästä. Tarkastelemme tässä yhteydessä 
vain tekstisanojen sanarakennetta. 

Johtamattomien tekstisanojen määrä on vallitseva koko aineistossa. 
Tämä on odotuksenmukaista, koska johtamattomat sanat ovat kielen 
yleisimpiä sanoja (ks. taulukko 51); lekseemitasolla aineiston tilanne on 
toinen. Johtamattomien tekstisanojen määrää selittää myös kirjoitelmien 
kertova luonne; abstraktiot, joita ilmaisevat sanat ovat tyypillisesti joh- 
doksia, ovat vähissä. Johtamattomien tekstisanojen määrä kuitenkin las- 
kee lähes lineaarisesti kirjoittajien luokka-asteen ja iän noustessa suku- 
puolesta riippumatta. Nuorimpien alakoululaisten ja aikuisten välinen 
ero on noin 15 prosenttiyksikköä, kuudesluokkalaisten ja aikuisten vajaa 
kymmenen prosenttiyksikköä ja yhdeksäsluokkalaisten ja aikuistenkin 
välillä on vielä selvä ero. Kun johtamattomien tekstisanojen määrä las- 
kee, johdettujen tekstisanojen määrä vastaavasti nousee. Kehitys on nyt 
vielä selvemmin lineaarista. Johdettujen sanojen lisääntyminen johtuu 
morfologisen tietoisuuden kehittymisestä ja ilmaisujen spesifisyysas- 
teen (granulariteetin) ja abstraktisuuden kasvusta. Sukupuoliero on jo 
odotuksen mukaan pieni, koska derivaatiomorfologian testauksessa sa- 
moilla koehenkilöillä ero ei ollut mainittava (ks. Vainio ja muut 2019). 
Toisaalta Kusnetsoffin (2017) mukaan sukupuolierot ovat vain derivaa- 
tion tunnistamistehtävissä pienet, tuottamistehtävissä suuret. 
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Taulukko 51. Sanarakenteen jakauma ikäluokittain. 


Ikäluokka / Johtamaton — Johdos — Yhdyssana = Kiteytynyt Muut 
Sanarakennetyypit % 

1-5. F 76,9 10,4 57 6,4 0,6 
1-5.M 75,2 10,2 ZI 59 L5 
Kuudes F 72 12,7 6,1 7,6 1,6 
Kuudes M 71,9 11,1 7,3 7,4 2,3 
Yhdeksäs F 70 15,1 6,4 7,5 0,9 
Yhdeksäs M 68,1 14,4 8,2 7,7 ET. 
AMK F 65,8 18,9 7,6 7,4 0,3 
AMK M 64,3 19,2 8,6 7,5 0,4 
Pääsy F 64,1 20,8 7,7 7 0,4 
Pääsy M 62,9 21,4 8,4 6,7 0,6 


Yhdyssanojen määrä on ensimmäisellä luokalla ja toisella aikuisryhmäl- 
lä sama ja vaihtelu on eri ryhmissä pientä, miehillä määrät ovat kor- 
keammat. Laadullisesti yhdyssanoissa tapahtuu muutosta. Nuorilla 
kirjoittajilla on paljon tavallisia yhdyssanoja (aamupala, syntymäpäivä) 
ja toisaalta satunnaismuodosteita (karkkikylpy, jäätelömaa), mutta van- 
hemmilla kirjoittajilla yhdyssanat ovat merkitykseltään spesifejä (hauta- 
vajoama, sukulaiskiintiö). Toisin sanoen ero on selvä lekseemitasolla. 
Sanomalehtikielessä yhdyssanojen osuus on 12,5 prosenttia eli selvästi 
korkeampi kuin nuorilla aikuisilla. Kiteytyneiden määrässä on hienoista 
nousua iän mukaan, mikä todennäköisesti viittaa tapahtumien tarkem- 
paan ajalliseen ja paikalliseen kehystämiseen, koska juuri kiteytyneissä 
sanoissa on paljon ajan ja paikan adverbeja. 

Yleisyysjakaumien tarkastelun keskitämme johtamattomien ja joh- 
dosten suhteeseen kuudennella ja yhdeksännellä luokalla sekä aikuisil- 
la. Jakaumat on muodostettu luokittelemalla kokonaissanamäärä suh- 
teessa johtamattomiin ja johdettuihin sanoihin. Johtamattomien luokat 
vaihtelevat alle 50 prosentista yli 90 prosenttiin kokonaissanamäärästä 
ja johdettujen alle viidestä prosentista yli 30 prosenttiin. Johtamatto- 
mien sanojen osuus peruskoululaisilla on yleisimmin 70-80 prosenttia 
tekstisanoista ja asettuu melko tasaisesti välille 60-80 prosenttia (ks. 
taulukko 52). Kuudennen ja yhdeksännen välinen ero on keskeisissä 
yleisyysluokissa noin 10 prosenttiyksikköä. Aikuisilla vaihtelu sijoittuu 
yleisimmin välille 60—70 prosenttia mutta yleisyysluokassa 50-60 on 
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jo melkoinen määrä aikuisista. Peruskoululaisten ja aikuisten välinen 
ero on keskeisissä yleisyysluokissa noin 30 prosenttiyksikköä ja se on 
siten huomattavasti suurempi kuin kuudennen ja yhdeksännen välinen 
ero. Näin suuret erot kirjoitelmissa käytetyn sanaston rakenteellisessa 
koostumuksessa vaikuttavat luonnollisesti suuresti ilmaisujen geneeri- 
syyteen ja spesifisyyteen, konkreettisuuteen ja abstraktiuteen. Ääriarvoja 
(yli 80 % sanoista johtamattomia) on kuudesluokkalaisilla lähes 10 pro- 
senttia eli väestötason kielellisen älykkyyden normaalijakaumaan näh- 
den liian paljon. 


Taulukko 52. Johtamattomien sanojen osuus kokonaissanamäärästä eri kirjoittajilla. 


Tkäluokka / Alle jo 50-59 60-69 70-79 80-89 90% 
Johtamattomien yleisyysluokat % 

Kuudes 0,9 3,2 34,2 52,4 8,3 0,9 
Yhdeksäs 1,9 7,5 44,4 43,1 3,1 o 
Aikuiset 0,9 24,9 60,8 13,4 o o 


Kuudesluokkalaisilla johdokset sijoittuvat enimmäkseen yleisyysluok- 
kiin 5-15 prosenttia kokonaissanamäärästä, yhdeksäsluokkalaisilla luok- 
kiin 10-20 prosenttia. Aikuisilla yleisyysluokka välillä 15-25 prosenttia 
on vallitseva: lähes puolella kirjoittajista tekstisanoista yli 20 prosenttia 
on johdettuja sanoja. Tämä aikuisilla yleisin luokka on peruskoululai- 
silla pieni. Nuorilla aikuisilla johdosten määrä tasaantuu ja vaihteluväli 
laskee välille 10-30 eli pysyttelee noin 20 prosenttiyksikössä. Tämä voi 
olla osoitus siitä, että aikuisten ryhmässä ei ole yhtä laajaa kirjoittajakir- 
joa kuin peruskoululaisten ryhmässä. Toisaalta kyse on myös derivaa- 
tiomorfologian hallinnan kehittymisestä. Ikäryhmittäin johdosjakauma 
on melko tasainen, mutta kuudesluokkalaisilla matalia arvoja on oletus- 
jakaumaan nähden liikaa. 

Esimerkkeihin 4-5 on valittu sekä kuudennelta että yhdeksänneltä 
näytteet, joissa on toisaalta mahdollisimman vähän johdoksia ja toisaalta 
mahdollisimman paljon. Johdosten suhteellinen osuus vaikuttaa melko 
luotettavalta kielenhallinnan kehitykselliseltä mittarilta. 
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Kuudes (johdoksia sanoista 2,3 %): 

43) JA voisin muuttaa johonki sinne missä pelaan. Se olisi hienoa 
voisin ostaa ison talon. Tai sitten voisin pelata SM sarjaa sumessa. 
(6M122) 


Kuudes (johdoksia sanoista 21,5 %): 

4b) Unelmieni päivän viettäisin jossain lämpimässä maassa, jossain 
rikkaassa paratiisissa. Haluaisin tietysti lentää sinne. Haluaisin liitää 
ja lentää hurjaa vauhtia. (6F10) 


Yhdeksäs (johdoksia sanoista 4,1 %): 

5a) Unelmapäiväni olisi varmaan se kun saisin koiran. Olen aina toi- 
vonut koiraa mutten vielä ole saanut sitä. Haluaisin myös lähteä ystä- 
väporukalla vaikka laivalle tai jonnekin kivaan lomapaikkaan. (9F16) 


Yhdeksäs (johdoksia sanoista 24,84 %): 

5b) Ratsastuksen ja pipareitten jakojen jälkeen menisimme takaisin 
tallille ja koristelisimme tallin jouluisaksi. Jokaisen hevosen karsinan 
oveen tulisi iso pipari, jonka hevoset saisivat myöhemmin syödä. (9F8) 


SANAMÄÄRÄN YKSILÖLLINEN VAIHTELU 
Kirjoitelman sanamäärä on tekstitason mittari, jolla on helppo poimia 
erilleen ne kirjoittajat, jotka ovat selvästi alle ikäluokan ja sukupuolen 
yleisen produktiivisuuden (ks. Price & Jackson 2015, 285). Jos sanamäärä 
on matalissa ääriarvoissa, kyse voi olla kielihäiriön tuomasta ongelmas- 
ta. Mittaamisessa ylilyhyet tai ikäluokalle sanamääriltään muuten epä- 
tyypilliset kirjoitelmat antavat ongelmallisia arvoja. Esimerkiksi käyvät 
jo esiin tulleet keskisanapituudet, jotka nuorimmilla pojilla osoittautu- 
vat epäodotuksenmukaisen korkeiksi. Syynä on kertovan tekstin kor- 
vannut substantiivivaltainen luettelo, josta kieliopilliset eli lyhyet sanat 
puuttuvat. On myös mahdotonta, että lyhyissä kirjoitelmissa tulisi esiin 
vaikkapa kertovan tekstin kaikki rakenneosat. Tilastollisista monimuut- 
tuja-analyyseista nämä ääriarvoja edustavat kirjoitelmat onkin poistettu, 
kuten jo edellä todettiin. 

Tän vaikutus sanamääriin on todettu merkitykselliseksi useissa kielis- 
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Kaavio 15. Unelmakirjoitelmien sanamäärä ja sen hajonta kirjoittajaryhmittäin. 


sä, mutta määrä sinänsä vaihtelee kielittäin (ks. Berman & Verhoeven 
2002, 23). Syynä vaihteluun ovat ennen kaikkea kielitypologiset erot 
mutta varmaan myös tyylieroja on. Samasta teemasta kirjoitettujen 
Unelmakirjoitelmien sanamäärä kasvaa lähes lineaarisesti koko perus- 
koulun ajan (ks. kaavio 15; ks. myös Pajunen 2012; Honko 2013). 
Kuudennenluokanaineisto kaaviossa 15 poikkeaa silmin nähden muista. 
Syy on sen koostumus. Aineisto on kerätty vuosina 2006 ja 2014: jäl- 
kimmäinen ryhmä on laatinut pidempiä tekstejä, mikä nostaa paitsi me- 
diaania myös hajontaa. Korkeampi kokonaissanamäärä ei kuitenkaan ole 
osoitus paremmasta tasosta vaan — tässä tapauksessa — yksinkertaisem- 
masta ja monisanaisemmasta rakenteesta (ks. Muhonen 2019). Vuo- 
den 2014 kirjoittajia pyrittiin motivoimaan elokuvalippuja arpomalla ja 
motivaatio ehkä nosti sanamäärää mutta ei rakenteen kompleksisuutta. 
Kompleksisuus tarkoittaa myös tiiviyttä, joten vuoden 2014 kirjoittajilla 
rakenne on paitsi yksinkertaisempi myös hajanaisempi. Rakenteellisesti 
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tarkasteltuna vuoden 2006 kuudesluokkalaiset muistuttavat enemmän 
vuoden 2014 yhdeksäsluokkalaisia kuin vuoden 2014 kuudesluokka- 
laisia. Yläkoulun seitsemännen ja kahdeksannen luokan kirjoittajia on 
muita vähemmän, joten nämä luvut eivät ole täysin edustavia. 

Peruskoululaisten kirjoitelmien sanamäärä vaihtelee luonnollisesti 
tehtävätyypin ja tehtävänannon mukaan, motivaation lisäksi suunnittelu 
voi nostaa sanamääriä. Lisäksi tekstityyppi voi vaikuttaa sanamäärään. 
Usein katsotaan, että erittelevä teksti on lyhyempi kuin kertova (Kout- 
softas & Gray 2012; Hall-Mills & Apel 2015). Aikuisten kirjoitelmissa 
sanamääräksi on ohjeistettu noin 300 sanaa. Toteutunut sanamäärä jää 
tämän alle, mutta hyvin monet kirjoittajat ovat pyrkineet kirjoittamaan 
täsmällisesti annetun ohjeen mukaan. Aikuisten kirjoitelmat on myös 
selvästi suunniteltu määrämittaisiksi. Vastaavasti peruskoululaisten 
kirjoitelmia jatketaan tarpeen vaatiessa kokonaisuudesta irrallisin lisä- 
tapahtumin. Vuoden 2014 kuudesluokkalaiset ovat turvautuneet juuri 
tällaisiin sattumalisäyksiin. Suunnittelun rooli on siis erilainen koulu- 
laisilla ja aikuisilla (vrt. Sintonen 2011 peruskoululaisista). 

Sanamäärän arvioimiseksi kirjoitelmat on uudelleen luokiteltu sana- 
määräryhmiin siten, että joka ryhmä kasvaa aina 50 sanalla (ks. taulukko 
53). Luokitus osoittaa, että kuudesluokkalaisista tytöistä kolme neljästä 
kirjoittaa yli 50 mutta alle 200 sanan kirjoitelmia, pojista runsas 6o pro- 
senttia. Neljännes kuudesluokkalaisista pojista kirjoittaa vielä hyvin ly- 
hyesti. Yhdeksäsluokkalaisilla tytöillä sanamäärä vaihtelee useimmiten 
sadasta yli kahteen sataan mutta poikien sanamäärät ovat samoissa kuin 
kuudesluokkalaisten poikien; silti hyvin lyhyiden tekstien kirjoittajat 
ovat vähentyneet. Aikuiskirjoittajilla sukupuoli ei ole enää merkitsevä. 
Johtopäätös kuitenkin on, että kirjoittamistaitojen tai -halujen kehitys 
ei näytä koskevan kaikkia kirjoittajia on sukupuoli kumpi tahansa. On 
tietysti myös niin, että kaikkien osaamista ei eri syistä saada esiin. Pa- 
laamme sanamääriin T-yksikköjen yhteydessä. 

Sukupuolen suuri rooli on suomen aineistossa hämmästyttävä. Esi- 
merkiksi Bermanin ja Verhoevenin (2002, 23—24) tutkimuksessa ei löy- 
detty sukupuolen mainittavaa vaikutusta sanamääriin. Tutkimuksessa 
verrattiin kahta eri tekstityyppiä (kertova ja erittelevä) ja modaliteettia 
(puhuttu ja kirjoitettu) edustavien tekstien avulla seitsemässä eri kielessä 
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Taulukko 53. Unelmakirjoitelmien sanamäärät kuudennella, yhdeksännellä ja nuorilla 
aikuisilla. 


Tkäluokka / 1-50 5I-100 101-150 151-200 201—250 251-300 Yli300 
Sanamääräluokat % sanaa 

Kuudes F 0,6 18,8 31,3 23,1 13,1 6,3 6,9 
Kuudes M 24,2 32 24,2 111 4,6 2,6 1,3 
Yhdeksäs F 45 13,6 23,9 20,5 19,3 7,9 10,2 
Yhdeksäs M 15,3 30,5 23,6 12,5 6,9 8,3 2,8 
Aikuiset F 0,4 0,4 L7 10,4 16,2 51,7 19,2 


Aikuiset M o o 1 9,3 17,5 49,5 22,7 


(englanti, hollanti, ranska, espanja, ruotsi, islanti ja heprea) neljän eri 
ikäluokan kirjoittamista. Ikäluokat olivat vastaavantapaiset kuin omassa 
aineistossamme. Ensimmäinen ryhmä olivat 9-10-vuotiaat, toinen 12—13- 
vuotiaat, 16-17-vuotiaat ja nuoret korkeakouluopiskelijat (20—30-vuo- 
tiaat). Saksalaisia yhdeksäsluokkalaisia koskevassa DESI-tutkimuksessa 
tytöt olivat poikia parempia kaikissa mitatuissa osa-alueissa mutta suu- 
rimpia erot olivat tuottavissa osioissa kuten kirjoittamisessa (DESI-Kon- 
sortium 2008, 202—203); sanamääriä ei tutkimuksessa kommentoida. 
Myös Yhdysvaltain kansallisessa arvioinnissa (8. ja 12.-luokkalaiset) kir- 
joittamistaidoissa on sukupuolieroja tyttöjen hyväksi (ks. NAEP 2011; 
Writing 2011). Erot eivät kuitenkaan ole kovin suuret, sillä esimerkiksi 
8.-luokkalaisten pistekeskiarvo on tytöillä 160 (maksimi 300) ja pojilla 
140. Arviointikriteereistä ja näytteistä voi päätellä, että kokonaissana- 
määrä on parhaissa teksteissä korkeampi kuin heikommissa, mutta sa- 
namäärä ei ole suoraan arviointikriteeri."* Wolf Nelsonin ja Van Meterin 
(2007, 301) tutkimuksessa sen sijaan sanamäärissä, T-yksiköiden ja kon- 
junktioiden määrissä on oletuksen mukainen merkitsevä päävaikutus 
sukupuolen mukaan mutta eroa ei ole lausetyypeissä eikä oikeinkirjoi- 
tuksessa. 


116 Arviointi perustuu kolmeen mittariin, jotka ovat ideoiden kehittely, ideoiden organisointi ja kieleen 
liittyvät resurssit ja konventiot. Jokaista arvioidaan kuusiportaisella asteikolla. Kirjoittajista puolet kuu- 
luu ns. perustasolle (pistekeskiarvo 155), jota luonnehditaan seuraavasti: ”-— used some details but 
details did not always convey an experiment, while organization was somewhat loose, word choice 
clear rather than precise, and sentence structure relatively unvaried.” Pistekeskiarvojen perusteella 
sekä tytöt että pojat kuuluvat keskimäärin tälle perustasolle. Noin 20 prosenttia kirjoittajista on pe- 
rustason alapuolella, 30 prosenttia ylittää perustason. 
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PISA-tutkimuksen yhteydessä on tullut esiin, että Suomessa tulokset 
sukupuolittuvat voimakkaammin kuin muissa PISA-maissa (ks. PISA 
2012; 2015; 2018). Opettajakommenttien mukaan suunta on alaspäin. 
Kyse saattaa olla myös länsimaisesta trendistä vaikkakin Suomessa eri- 
tyisen voimakkaasta." Toisaalta on tutkimustuloksia, jotka osoittavat, 
että vaikka tyttöjen kirjoitelmissa on enemmän sanoja kuin poikien, 
kirjoitelmien laatu ei silti eroa (ks. Babayigit 2015, 34). Kokonaissana- 
määrä yksinään on ongelmallinen mittari mutta osoittaa kyllä ikäluokan 
keskimääräistä kehitystä etenkin nuoremmilla kirjoittajilla. 


Sanaluokkaindeksit 


Sanaluokkaindeksejä on useita, ja niiden avulla voidaan laskea teksti- 
tyyppi- tai lajikohtaisia tekstin tyyppiarvoja, laskea tekstin informatii- 
visuutta ja tutkia jonkin tarkkaan valitun ilmiön esiintyvyyttä (ks. esi- 
merkiksi Berman, Nayditz & Ravid 2011; Price & Jackson 2015, 283; 
Hall-Mills & Apel 2015). Käsittelemme tässä yhteydessä substantiivi- 
verbi-suhdetta (= NTVR eli noun-to-verb ratio) ja leksikaalista tiheyttä 
(lexical density), joilla kehitystä voidaan arvioida ja jotka helposti osoitta- 
vat myös tekstien tyyppieroja. NTVR-arvo ilmaisee kompleksisuutta as- 
teikolla yksinkertainen/puhekielinen vs. abstrakti, toisin sanoen korkea 
substantiiviosuus viittaa tekstin korkeaan abstraktiotasoon. Puhekieli- 
sessä tekstissä on paitsi lyhyet lauseet suhteessa paljon finiittiverbejä, 
abstraktissa tekstissä on suhteessa paljon substantiiveja. Tämä yleistys 
pätee erityisesti yhdistettynä korkeaan leksikaalisen tiheyteen sekä lau- 
seiden korkeisiin sanamääriin. Lähinnä omaelämäkerrallisissa kertovis- 
sa teksteissä substantiivien ja verbien suhde on todennäköisesti lähellä 
yhden suhdetta yhteen. 

Leksikaalinen tiheys ilmaisee leksikaalisten sanaluokkaesiintymien 
osuutta kokonaissanamäärästä. Leksikaalisia sanaluokkia ovat substantii- 
vit, verbit ja adjektiivit sekä adverbeista ne, joiden kantasana ei ole prono- 


117 Esimerkiksi Scandinavian Association of Cognitive Linguistics -konferenssissä vuonna 2017 keskus- 
teltiin poikien heikoista kirjoittamistuloksista länsimaisena trendinä. 
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minaalinen. Leksikaalisten sanaluokkien vastakohta on kieliopilliset sa- 
naluokat, kuten konjunktiot ja pronominit, joiden merkitys on tyypillises- 
ti abstrakti ja joiden tehtävät ovat lähinnä syntaktisia. Leksikaalinen ti- 
heys kuvaa tekstin informaatiopitoisuutta, sitä, kuinka paljon tarkoitteita 
ja tapahtumia tekstiin tuodaan ja kuinka paljon niitä luonnehditaan ja 
kehystetään aikaan ja paikkaan. Teemme myös sanaluokkakohtaisempia 
laskelmia kompleksisuuden erittelemiseksi tämän teoksen loppuluvussa. 

Tekstiin liittyvän sanaluokkaindeksin arvo ei voi olla mikä tahansa: 
Jos NTVR-suhde (N/N+V) on hyvin korkea tai hyvin matala, kyse on 
substantiivi- tai verbiluetteloista ei kertovasta tai kuvailevasta tekstistä. 
Jos leksikaalinen tiheys (N+V+A+Adv/kokonaissanamäärä) on hyvin 
korkea, tekstistä puuttuu sidoksisuus ja se lähinnä luettelee tarkoitteita. 
Siten indeksien arvojen suuren vaihteluvälin voi tulkita osoittavan, että 
ikäluokan kaikki kirjoittajat eivät vielä kirjoita onnistunutta tekstiä. 
Indeksit ovat myös mitä ilmeisemmin tekstityyppi- ja lajisidonnaisia. 
Berman ja muut (2011) osoittavat, että erittelevän tekstin leksikaalinen 
tiheys on korkeampi kuin kertovan. Biberin ja muiden (1998) mukaan 
NTVR-suhde on englanninkielisessä tieteellisessä tekstissä 2,211 (eli 
substantiiveja on kaksinkertainen määrä verbeihin verrattuna), mutta 
fiktiossa ja puheessa lähempänä yhden suhdetta yhteen. Indeksien arvot 
ovat kielikohtaisia — tämä pätee erityisesti leksikaaliseen indeksiin — ja 
toisaalta niihin vaikuttaa myös valittu laskentaperiaate. 

Unelmakirjoitelmat on sanaluokitettu tietokantaan pääsanaluokkiin 
ja alaluokkiin. Indeksit on laskettu pääsanaluokista muutamin poikkeuk- 
sin. Kehityksellisesti erottelevien pronominikantaisten adverbien suuri 
joukko ei ole laskelmissa mukana toisin kuin pronominaaliadjektiivien 
pieni joukko. Propreja ei ole erotettu appellatiiveista. Kiteytymät eivät 
ole mukana NTVR-arvossa mutta kylläkin leksikaalisessa indeksissä. 
Verbeihin on luettu kaikki verbiparadigmassa taipuvat paitsi leksikaa- 
listuneet partisiipit. Toisin sanoen substantiivien ja verbien suhde on 
pyritty laskemaan juuri näissä funktioissa käytetyistä sanoista ja leksi- 
kaaliseen tiheyteen vaikuttaa kaikki ns. leksikaalinen aines. Indeksien 
arvoihin vaikuttaa kuitenkin myös se, erotellaanko yhden ja saman sa- 
nan leksikaalinen ja kieliopillinen käyttö vai ei (vrt. O'Loughlin 1995; 
Biber ja muut 1998); näin ei ole tehty omassa aineistossamme. 
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Pyrimme tässä yhteydessä osoittamaan jonkinlaisen luontevan vaihte- 
luvälin kirjoitelma-aineiston avulla kyseisille indekseille kehityksellisen 
näkökulman lisäksi. Vertailulukuja ei ole valmiina isoista korpuksista 
mutta Savon Sanomien korpuksen miljoonan sanan otoksesta laskim- 
me samoilla kriteereillä vastaavat arvot. Indeksit on laskettu 1717 kirjoi- 
telmasta, joissa on yhteensä 218 849 tekstisanaa. Kirjoittajista 939 on 
naispuolisia, 778 miespuolisia. 


SUBSTANTIIVIEN JA VERBIEN KESKINÄINEN SUHDE 
Substantiivien ja verbien keskinäinen suhde eli NTVR näyttää Unelma- 
kirjoitelmissa oletuksen mukaan olevan — keskimäärin — melko lähellä 
yhden suhdetta yhteen erityisesti alakoululaisilla (ks. kaavio 16). Tämä 
tarkoittaa esimerkiksi sitä, että alimmilla luokilla kirjoitelmat ovat raken- 
teltaan yksinkertaisia, lähellä puhutun kielen mallia, lauseet ovat melko 
lyhyitä, subjektina toimii pronomini (ks. tarkemmin Pajunen 2012) ja 
kompleksiset rakenteet ovat vähissä. Substantiivien osuus alkaa nousta 
kolmannelta luokalta yläkoulun alkuun. Pieni notkahdus seitsemännen 
ja kahdeksannen luokan aineistoissa liittynee melko pieneen kirjoitta- 
jamäärään. Kuudennen ja yhdeksännen välillä ei ole mainittavaa eroa. 
Nuorilla aikuisilla NTVR on 1,1:1 (eli mediaani on 55). Kolme neljäsosaa 
kirjoitelmista ylittää yhden suhteen yhteen, keskeiset NTVR-mediaanit si- 
joittuvat lapsilla ja nuorilla välille 50-53, aikuiskirjoitelmissa välille 50-57, 
toisin sanoen substantiiveja on jonkin verran enemmän kuin verbejä. 
Tulos — substantiivien suhteellinen vähyys — on yllättävä, jos ajattelee, 
että sekä verbin argumentit että monet lokalisoivat ja kehystävät ainekset 
ilmaistaan suomessa substantiiveilla. Yksittäisessä lauseessa olettaisi aina 
olevan useita substantiiveja. Sanomalehtikielessä NTVR onkin huomat- 
tavasti korkeampi eli 65,9, ero viittaa selvästi tekstityyppi- ja lajieroon. 
Tulosta selittävät monet kertovan kielen piirteet: minä-kerronta laskee 
substantiivien määrää ja vastaavasti erityisesti päivä-skeemassa kerronta 
etenee siirtymiä ilmaisevin yhden argumentin intransitiiviverbein (ks. 
Vesala 2012). Matalaa NTVR-arvoa selittää muun muassa runsas kon- 
jugoivien verbien ja pronominien käyttö (vrt. esimerkki 6), vastaavasti 
korkeata NTVR-arvoa tuntuu selittävän luettelomaisuus ja ehkä ongel- 
mat lauseiden muodostamisessa (vrt. 7). 
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Substantiivien ja verbien suhde 


4: 2. 3. 4. 5. 6. 7. 8. g. AMK Pääsy 
Ikäluokka 


Kaavio 16. Substantiivien ja verbien keskinäinen suhde (= NTVR) Unelmakirjoi- 
telmissa (n = 1774). 


NTVR on 35,3: 

6) Aamulla kun heräsin äiti oli kattanut aamupalaksi minun lempi 
murojani, joita en yleensä saa aamupalalla syödä. Kun olin syönyt, 
äiti kysyi: Menisimmekö serkkujen luokse? Minä tietenkin innokkaana 
sanoin: mennään! (5F60) 


NTVR on 64,3: 

7) Unelmieni päivä olisi jos voittaisin lotossa. Saisin paljon rahaa ja 
ostaisin kaikkea. Esim. Auton, kartanon, uima-altaan kartanoon, 
palkkaisin hovimestarin, kokin ja siivoojan. Ostaisin vielä huvijahdin 
ja karkkitehtaan. (5M138) 
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NTVR-arvojen vaihteluväli on koko aineistossa suuri mutta mediaani 
asettuu välille 50—53,6, keskihajonta on 5,8. Kaikkein nuorimmilla kir- 
joittajilla hajonta on suurinta, ensimmäisellä luokalla mediaani on 50 
mutta keskihajonta jopa 48,9. Keskeisten havaintojen osalta vaihteluväli 
kapenee alakoulun puolivälistä alkaen nopeasti ja osoittanee koherentin 
tekstin tuottamistaitojen syntyä ja kehitystä. Myös mediaanin nouseva 
suunta osoittaa kehityksellistä muutosta. 

Kun NTVR-arvoa tarkastellaan uudelleenluokittelemalla havainnot 
ryhmiin alle 40-yli 65, normiarvot ovat 1-1,1:1 kaikilla muilla paitsi ai- 
kuisilla miehillä, joilla arvot ovat hieman korkeampia (ks. taulukko 54). 
Keskeiset arvot sijoittuvat välille 46-60 ja muut arvot ovat enemmänkin 
poikkeavia. Lisäksi substantiivien suhteellinen osuus kasvaa iän myötä. 
Mieskirjoittajilla vaihtelu on suurempi kuin naiskirjoittajilla mutta nou- 
see iän mukaan nuoremmilla tavallisimmasta mediaaniluokasta 51-55 
luokkaan 56-60. Kuudennen tytöt poikkeavat yleiskuvasta yhtä selvästi 
kuin aikuiset miehet: mediaanit vaihtelevat luokassa 46-55, mikä viittaa 
melko yksinkertaiseen tyyliin. Kuudennen ja yhdeksännen pojilla on 
paljon ääriarvoja eli osoituksia tekstinmuodostamisongelmista. 


Taulukko 54. NTVR-suhde koehenkilöittäin Unelmakirjoitelmissa. 


Tkäluokka / Alle 40 40-45 46-50 51-55 56-60 6165 Yli65 
NTVR-luokat % 

Kuudes F 2,5 7,5 30,0 32,5 16,9 7,5 3,1 
Kuudes M 8,5 13,1 13,1 31,4 16,3 9,1 8,5 
Yhdeksäs F 3,4 10,2 19,3 39,8 14,8 11,3 11 
Yhdeksäs M 6,9 6,9 20,8 29,2 18,0 13,9 4,2 
Aikuiset F 1,7 5,4 20,8 34,1 26,7 10,4 0,8 
Aikuiset M 2,1 6,2 19,6 23,7 35,0 11,3 2,0 


Kertovan tekstin ominaisuus näyttää olevan melko matala NTVR Biberin 
ja muiden (1998) ennusteen mukaan, lisäksi se nousee ikäluokittain 
hitaasti. Kun kertovassa tekstissä on substantiiveja hieman enemmän 
kuin verbejä ja kun kirjoittajien väliset ikäluokkakohtaiset erot ovat pie- 
nehköt, kerronta on melko tasapainoista. NTVR-arvoa olisi hyvä voida 
verrata myös muihin tekstilajeihin, mutta suomen kielestä vertailuaines 
Savon Sanomien aineistoa lukuun ottamatta puuttuu. NTVR-arvo olisi 
hyvä laskea myös sanojen funktion mukaan analysoiden. 
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LEKSIKAALINEN TIHEYS 

Leksikaalinen tiheys kuuluu leksikaalisen rikkauden mittareihin diver- 
siteetin ja yleisyystasoanalyysin lisäksi (ks. esimerkiksi Read 2000; Jo- 
hansson 2008; Jarvis 2013; Honko ja muut 2019; Pajunen & Honko 
tässä teoksessa). Leksikaalinen tiheys mittaa niin sanottujen sisältösano- 
jen eli kielenulkoisiin tarkoitteisiin ja tapahtumiin viittaavien sanojen 
määrää tekstissä. Se osoittaa, miten informaatiopitoista teksti on, mutta 
luonnollisesti tiheys jälleen vaihtelee eri tekstilajeissa ja kirjoittamis- 
tyyleissä. Lisäksi informatiivisuuteen vaikuttaa diversiteetin (eli eri lek- 
seemien määrän) lisäksi leksikaalinen toisteisuus. Kaikista näistä in- 
dekseistä voi tehdä päätelmiä tekstin sisällön luonteesta, sen välittämän 
tiedon määrästä. Yleisesti tiedetään, että sisältö monipuolistuu kehi- 
tyksellisesti (vrt. Heinonen 2018), mutta on syytä muistaa, että korkea 
tiheys ei sinänsä tarkoita hyvää tekstiä (vrt. Jarvis 2013; Honko ja muut 
2019). Samoja indeksejä käytetään myös luettavuuden arviointiin. 

Tiheys voidaan laskea vähintään kolmella eri tarkkuudella (Johansson 
2008). Ensimmäinen ja tässä noudatettu on, että sisältösanojen esiinty- 
mät lasketaan funktioita huomioimatta, esimerkiksi voida-verbiä ei ala- 
luokitella leksikaaliseen ja kieliopilliseen. Toinen vaihtoehto olisi analy- 
soida referentiaalisesti käytetyt leksikaaliset ainekset erikseen ja kolmas 
olisi jättää muun muassa olla-verbi kokonaan huomiotta. Periaatteessa 
leksikaaliset sanaluokat eli substantiivit, adjektiivit ja verbit sekä myös 
adverbit ovat juuri sisältösanoja, konjunktiot, artikkelit ja niin edelleen 
kieliopillisia sanaluokkia. Sisältösanat voidaan kielissä määritellä monil- 
la kriteereillä, ja vaikka etenkin substantiivit ja verbit ovat universaaleja, 
leksikaalista tiheyttä on vaikea laskea eri kielissä aivan samoin periaat- 
tein. Lisäksi tutkijoilla on omia valintojaan. Esimerkiksi O'Loughlin 
(1995, 228) ei lue leksikaalisiin sanoihin modaaliverbejä, be- ja have-ver- 
bejä eikä pronominaaleja. 

Suomen kielessä modaaliverbien luokka ei ole täysin vakiintunut 
mutta voi kysyä, eikö modaaliadverbitkin pitäisi erotella aineistosta, jos 
kerran modaaliverbit erotetaan. Modaaliverbien määrä verbiesiintymis- 
tä on aineiston aikuiskirjoittajilla hieman peruskoululaisia suurempi 
mutta niiden esiintymät kaikista verbiesiintymistä ovat tiheyslukujen 
kannalta pienet. Keskinen (2012) analysoi Unelmakirjoitelmien modaa- 
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listen ainesten käyttöä alakoululaisilla ja osoittaa muun muassa, että 
paitsi määrien hienoista kasvua muutosta tapahtuu myös funktioissa 
siten, että nuorimmat käyttävät modaaliverbejä useammin deonttises- 
sa (eli mitä saa tehdä) ja vanhemmat dynaamisessa funktiossa (mitä 
kykenee tekemään). Givönin (2009, 123) mukaan tämä on lasten kie- 
len kehityksessä yleinen trendi. Olla-verbi kopulana on eri asemassa 
kuin olla-verbi liittotempusten tai kiellon yhteydessä. Alakoululaisten 
aineistossa liittotempusten käyttö on vähäistä (15 % finiittisistä) mutta 
aikuisilla vajaat 30 prosenttia olla-esiintymistä kuuluu liittotempuksiin; 
toisaalta olla-verbi on muuten alakoululaisilla yleisempi kuin aikuisilla. 
Onkin todennäköistä, että leksikaalisten sanojen kieliopillisen käytön 
huomioiminen ei suuresti vaikuttaisi nykyjakaumaan. Substantiiveista 
ei erotella propreja, vaikka se voisi olla järkevää, koska ne eivät ole si- 
sältösanoja vaan nimiä. Proprien osuus leksikaalisista sanoista laskee 
alakoululaisten viidestä prosentista nuorten aikuisten 1,7 prosenttiin. 
Adverbeista erotetaan pronominaaliadverbit, joiden määrä laskee ke- 
hityksellisesti (ks. Koivunen 2012), mutta pronominaaleja ei eroteta 
adjektiiveista, koska niiden määrä on olematon. Joka tapauksessa leksi- 
kaalinen tiheys vaihtelee arvioitavan kielen typologisten ominaisuuksien 
perusteella; suomessa tiheys on välttämättä aika korkea ja huomattavasti 
korkeampi kuin lähes analyyttisessä englannissa. Tarkempi laskutapa 
saattaisi hieman laskea nuorimpien leksikaalista tiheyttä ja nostaa van- 
hempien. Lisäksi olisi hyödyllistä erotella leksikaalisten sanaluokkien 
edustajat konkreettisuusasteikon mukaisesti (vrt. Ravid 2006; Berman 
& Nir 2010); tähän jaotteluun tukeudutaan toisessa yhteydessä (ks. Paju- 
nen ja Honko, tämä teos). 

Unelmakirjoitelmat ovat samasta aiheesta ja ohjaavat omaelämäker- 
tomiseen — kuten on jo todettu. Pääosin ne edustavat kertovaa tekstiä, 
jossa on kirjoittajakohtaisesti ja iän mukaan lisääntyvästi kuvailua ja 
erittelyä. Tekstien keskinäisessä vertailussa leksikaalinen tiheys on in- 
formatiivinen indeksi ja todennäköisesti kuvaa yleisemminkin synteet- 
tisen suomen kielen kertovan tekstin ominaisuuksia. Tiheys sijoittuu 
peruskoululaisilla keskimäärin noin 75 prosenttiin eli yleensä noin 
75 prosenttia kertovien kirjoitelmien tekstisanoista on leksikaalisia (ks. 
kaavio 17). Aikuisilla mediaani on 77 prosenttia ja keskeiset havainnot 
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Kaavio 17. Leksikaalinen tiheys ja sukupuoli. 


asettuvat välille 75-80 prosenttia (vrt. esimerkit 8 ja 9); erot selittynevat 
todennäköisimmin kirjoittajien eri kehitysvaiheista ja kertovan ja toi- 
saalta kertovan ja erittelevän tekstin eroista. Keskeisten havaintojen 
osalta peruskoulun alaluokilla on enemmän hajontaa kuin ylemmillä. 
Vaikka tekstin leksikaalinen tiheys olisi korkea (kuten esimerkissä 9), 
NTVR-arvo voi olla matala (esimerkissä 9 51,6). Arvioimme mittareiden 
ristikkäisyyttä seuraavassa luvussa. 


Leksikaalinen tiheys on 73,7 (kolmannen luokan mediaani): 

8) Unelmieni päivä oli päivä joka oli kesälomalla. Unelmieni päivä oli 
kun isi ja äiti veivät minut ja pikku siskoni vaassalandiaan. Olimme 
vaasa Landiassa kaksi yötä. Meidän huone oli neljännessä kerroksessa. 
Aina illalla ja aamulla menimme uimaan. (3F37) 
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Leksikaalinen tiheys on 79,2 (nuorten aikuisten mediaanin ylä- 
puolella): 

9) Oli kaunis syyskuun päivä New Yorkissa. Ilma oli selkeä, ja tulevan 
syksyn saattoi aistia kipakasta tuulesta. Kävelin Brooklynin katuja take 
away -kahvi kädessäni höyryten. Olin tullut New Yorkiin muutama 
viikko aiemmin. (PääsyF70) 


Leksikaalisen tiheyden mediaani on peruskoulussa tytöillä hieman kor- 
keammalla kuin pojilla, aivan nuorimpia lukuun ottamatta. Molemmilla 
tiheyden vaihteluväli etenkin keskeisten havaintojen osalta iän mukaan 
pienenee. Ääriarvoja on kaikissa ryhmissä. Aikuiskirjoittajilla molem- 
missa kirjoittajaryhmissä tiheys on miehillä korkeampi kuin naisilla. 

Leksikaalinen tiheys keskittyy yleisyysluokkiin 70-80 kaikissa ikäryh- 
missä mutta nousee iän mukaan (taulukko 55). Yhdeksäsluokkalaisten 
tyttöjen jakauma jo lähenee aikuisten vastaavaa. Peruskoulussa sekä 
kuudennen että yhdeksännen pojilla jakauma näyttää aika samanlaiselta 
ja kummassakin ryhmässä on paljon ääriarvoja, mikä jälleen viittaa on- 
gelmiin tekstinmuodostuksessa. Vain kolmannes peruskoulun pojista 
sijoittuu luokkaan 75-80 prosenttia. Luokassa alle 65 prosenttia arvot 
ovat selvästi poikkeavia kaikilla kirjoittajilla. Ylimmässä luokassa on 
melko paljon kaikkien ikäryhmien kirjoittajia mutta kuudennen pojilla 
korkea leksikaalinen tiheys viittaa luetteloon, aikuisilla erittelyyn. Sano- 
malehtikielessä leksikaalinen tiheys on miljoonan sanan otoksesta las- 
kettuna hieman korkeampi kuin kertovassa tekstissä eli 81,5. Kun lehti- 
kielen indeksi vertailun vuoksi lasketaan 100 000 tekstisanan otoksista, 
käy ilmi, että luku pysyttelee aika vakiona. 


Taulukko 55. Leksikaalinen tiheys koehenkilöittäin Unelmakirjoitelmissa. 


Ikäluokka / Leksikaalisen Alle 65 65-69 70-74. 75-79 — 8otaiyli 
tiheyden luokat % 

Kuudes F 1;2. 10 35,6 35,6 17,5 
Kuudes M 3,9 16,4 30,3 29,6 19,7 
Yhdeksäs F 11 10,2 28,4 48,8 11,4 
Yhdeksäs M 6,9 16,7 33:3 26,3 16,7 
Aikuiset F 0,8 3,7 22,5 48,3 24,6 
Aikuiset M 1,0 4,1 16,5 49,5 28,8 
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SANALUOKKAINDEKSIT JA HOLISTINEN ARVIO 
Käsitys sekä NTVR-arvon että leksikaalisen tiheyden vakiintumisesta 
tekstin onnistuneisuuden myötä vahvistuu, kun alakoululaisten aineis- 
tosta tehty tasoluokitus (ks. taulukko 56) ristiintaulukoidaan sanaluokka- 
indeksien kanssa (kaaviot 18—21). Tasoja on nuorimmilla (luokat 1.-5.) 
neljä (ks. Pajunen 2012): luettelo tai lista (kaavioissa numero 1), epäloo- 
ginen tai muuten epäonnistunut, kesken tai muuta sellaista (numero 
2), juonirunko eli tapahtumia luetteleva skripti (numero 3) ja kertomus- 
skeemaa noudattava (numero 4). Bermanin (2007, 348) ja Hickmannin 
(2003) mukaan noin kymmenvuotiaat lapset ovat jo sisäistäneet kerto- 
musrakenteen mallin eli skeeman ja hallitsevat myös viittaussuhteet 
kertomuksen osallistujiin sekä aikaan ja paikkaan. Todettakoon lyhyesti, 
että jopa kuudesluokkalaiset 2000-luvun suomalaislapset jäävät kauaksi 
näistä taidoista. Kuudensista luokista on tehty myös hieman tarkempi 
holistinen luokitus, joka erottelee tasoluokan 2 toisaalta epäloogiseksi 
(2a), toisaalta otsikon vierestä kirjoitetuksi (2b). Lisäksi luokan 3 skriptit 
on jaettu kahtia hyvin pelkistettyihin (3a) ja hieman kertovampiin (3b). 
Skriptien joukko kasvaa selvimmin kehityksellisesti, mutta kertomus- 
skeemaa noudattavia kirjoitelmia on odotusarvoon nähden alakoulun 
ylimpienkin tytöillä melko vähän pojista puhumattakaan. Vuoden 2006 
kuudennen luokan tytöt ovat kirjoittaneet enemmän kertomuksia kuin 
vuoden 2014 tytöt, joille skripti on tyypillisin. Osa tutkijoista pitää kerto- 
musrakenteen tapaisten holististen mittarien käyttöä arveluttavana, kos- 
ka arviointi on vaikeaa, skeemat varioivat kulttuurisesti ja niin edelleen. 
Etusijalle asettuisi koherenssia luovien keinojen käytön vertailu (Burns 
ja muut 2012, 132). Toisaalta kuitenkin koherenssi ja kertomusrakenne 
suhteutuvat toisiinsa (vrt. Kouvo ja muut, tämä teos). 
Kertomusskeemaa noudattavissa kirjoitelmissa sekä NTVR:n että 
leksikaalisen tiheyden keskeiset arvot (25—75 %) vaihtelevat mediaanin 
ympärillä vähän ja vastaavat aikuisarvoja (ks. kaaviot 18—21). Muissa ho- 
listisen arvioinnin tyypeissä vaihtelua on paljon enemmän, erityisesti 
poikien teksteissä on ääriarvoja. Tarkastelu osoittaa, että kertovalla teks- 
tillä todella on tyypilliset leksikaalisten indeksien arvot. Jopa hyvissä 
skripteissä arvot vaihtelevat enemmän kuin kertomusskeemaa noudat- 
tavissa. 
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Taulukko 56. Alakoululaisten Unelmakirjoitelmien holistinen arvio. 


Ikäluokka / Luettelo/ Epälooginen/ Skripti Kertomus 
Tasoluokka % Lista Kesken 

Ensimmäinen F 38,6 28 17,5 15,8 
Ensimmäinen M 62,5 17,8 19,6 0,0 
Toinen F 18,7 16,5 38,5 26,4 
Toinen M 50,0 19,0 25,0 5,9 
Kolmas F 11,6 15,9 43,5 29,0 
Kolmas M 28,2 10,6 43,5 17,6 
Neljäs F 16,8 2,0 44,2 37,0 
Neljäs M 31,3 19,3 42,0 7,2 
Viides F 2,7 2,7 44,6 50,0 
Viides M 16,4 22,8 31,6 29,1 
Kuudes F o 5,6 59,4 35,0 
Kuudes M 5,9 11,2 71,8 11,2 


Holistinen arvio 


Kaavio 18. Alakoululaisten 1-5. kirjoitelmien NTVR holistisin tasoluokittain. 
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Kaavio 19. Kuudesluokkalaisten kirjoitelmien NTVR ja tarkempi holistinen arvio. 
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Kaavio 20. Alakoulun luokkien 1.5. kirjoitelmien leksikaalinen tiheys tasoluokittain. 
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Kaavio 21. Kuudesluokkalaisten kirjoitelmien leksikaalinen tiheys tasoluokittain. 


T-yksiköt ja lauserakenteen kompleksisuus 


T-yksikköön eli terminaaliyksikköön tiivistetään itsenäisten propositioi- 
den merkityssisältö suhteessa pääpropositioon. Se kertoo siten koehen- 
kilön näkemyksen tapahtumien keskinäisistä ajallisista tai esimerkiksi 
kausaalisista suhteista. Jotta analysoija ei pyri tulkitsemaan kirjoittajan 
päämääriä, T-yksikön koostamisperiaatteet ovat tiukat. T-yksikkö raken- 
tuu aina kirjoittajan päälauseeksi merkitsemään lauseeseen ja ottaa jä- 
senikseen sille muodollisesti alisteiseen suhteeseen merkityt lauseet. 
T-yksikkö vastaa jossain määrin virkkeen käsitettä mutta voi olla lausetta 
laajempi ja toisaalta virkettä suppeampi yksikkö. Ero virkkeisiin näkyy 
etenkin rinnasteisten päälauseiden kohdalla: Lauseet Pekka istui ja Matti 
seisoi kuuluvat samaan virkkeeseen mutta eri T-yksiköihin (ks. Schneider 
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ja muut 2005). Sen sijaan lauseet Pekka istui Matin seistessä tai lauseet 
Pekka istui ja ajatteli kohta nukahtavansa kuuluvat paitsi samaan virkkee- 
seen myös samaan T-yksikköön."? 

T-yksikköjen avulla saadaan kaksi kehityksellistä mittaria. Ensinnä sen 
avulla lasketaan kehityksellisessä tutkimuksessa keskeisin vertailuyksikkö 
eli T-yksikön keskipituus sanoina (= MLTU) ja toiseksi T-yksilöiden 
avulla mitataan lauserakenteen kompleksisuutta niin sanotulla kom- 
pleksisuusindeksillä (= CI). Tämä indeksi ilmaisee, montako propo- 
sitioon palautuvaa lausetta tai ei-finiittistä rakennetta on keskimäärin 
tiivistetty samaan T-yksikköön eli kuinka tiivistä ja informaatiokulun 
kannalta painotettua tekstiä kirjoittaja tuottaa. T-yksikön keskipituus 
ja kompleksisuusindeksi ilmaisevat siis molemmat kompleksisuutta. 
Matala arvo viittaa kummassakin yksinkertaiseen ja vastaavasti korkea 
kompleksiseen rakenteeseen, mutta keskipituus ilmaisee enemmän 
kielenyksikköjen määrää, kompleksisuusindeksi niiden hierarkkista 
suhdetta. 

T-yksiköt määritellään siis juuri sen mukaan, miten alisteisuus on 
merkitty tekstiin ilmimorfeemeilla. Esimerkiksi rinnasteiset relatiivi- 
lauseet otetaan huomioon saman T-yksikön jäseninä vain silloin, kun 
molemmat on merkitty relatiivisanalla alisteisiksi (mies joka x ja joka y). 
Unelmakirjoitelmissa on suhteellisen vähän tällaisia rakenteita, koska 
mahdollisista rinnasteisista sivulauseista jälkimmäisen muodollinen 
alistuksen merkki usein puuttuu, vaikka semanttisesti yksikköjen suhde 
olisi ymmärrettävä alisteiseksi. Esimerkki 10 on tässä suhteessa edus- 
tava: ajatuksen löytyminen edellyttää, että loppuosa luetaan muodossa: 
tai jotka itse kiusaavat. 


10) (T-1) Haluan puhua lapsille ja nuorille, joita koulukiusataan (T-2) 
tai he itse kiusaavat. (9F16) 


On tapana sanoa, että T-yksiköillä mitataan syntaktista tiiviyttä (syntactic/ 
clausal density, ks. Nippold ja muut 2014), kirjoittajan kykyä tiivistää 


118 Hankkeessa on erikseen tutkittu myös virkkeen koostumusta ja lauseiden sanamääriä. Molemmissa 
muutokset ovat kehityksellisiä. Ks. alakoululaisista Elomäki 2011; yläkoululaisista Oinonen 2008. 
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sanomaansa ja suhteuttaa vähemmän tärkeä tärkeämpään. T-yksiköillä 
voidaan myös arvioida kirjoittajan tapaa luoda tekstiinsä koherenssia. 

Kirjallisuudessa T-yksikköjen määrittely vaihtelee jonkin verran (vrt. 
esimerkiksi Scott & Windsor 2000; Berman & Verhoeven 2002; Nippold 
ja muut 2005; 2007; Price & Jackson, Schneider ja muut 2005). Toisi- 
naan otetaan huomioon alisteisina rakenteina vain sivulauseet eli niin 
sanotut nominaaliset (argumenttiasemassa olevat komplementtilauseet), 
relatiiviset ja adverbiaaliset sivulauseet (ks. esimerkiksi Nippold ja muut 
2005). Toisinaan otetaan huomioon sivulauseiden lisäksi kaikki propo- 
sitiota kielentävä ja alisteiseksi tulkittava infiniittinen aines (Schneider 
ja muut 2005). Kolmas vaihtelu liittyy alisteisen rakenteen position huo- 
mioimiseen. Esimerkiksi sivulauseet voidaan jakaa vasemmalle tai oi- 
kealle haaroviin; vasemmalle haarovuus on oletuksen mukaan komplek- 
sisempaa kuin oikealle, ainakin se on prosessoinnin ja muistin kannalta 
vaativampaa. T-yksiköt ovat yleensä käytössä kirjoitettua kieltä analysoita- 
essa ja pienten lasten puhetta analysoidaan niin sanottujen C-yksikköjen 
avulla, joilla voi ottaa epätäydelliset rakenteet paremmin huomioon (ks. 
Nieminen 2007). Noudatamme tässä yhteydessä Schneiderin ja muiden 
(2005) analyysiä, joka on alun perin tehty englannin kieleen mutta joka 
on helposti sovellettavissa myös suomeen. Huomioimme T-yksikköön 
kaikki alisteiset sivulauseet, lauseenvastikkeet, rektion omaisesti pääver- 
biin liittyvät infinitiivit, suorat ja epäsuorat lausemuotoiset lainat ja niin 
edelleen. Arvioimme kirjoitelmia T-yksikköjen kokonaismäärän, niiden 
sanamäärän sekä niistä lasketun kompleksisuusindeksin kautta. T-yksik- 
köjen jäsenten asemaa suhteessa päälauseeseen arvioidaan hankkeessa 
erikseen (ks. Muhonen 2019; Tiiro 2021). 


T-YKSIKKÖJEN MÄÄRÄ KIRJOITELMISSA JA NIIDEN KESKIPITUUS 
SANOINA 

T-yksikköistä voidaan laskea paitsi niiden kokonaismäärä myös niissä 
olevien sanojen keskimääräinen määrä. T-yksiköt ilmaisevat osaltaan, 
miten laajoja kokonaisuuksia kirjoittaja pitää mielessään ja yhdistää sa- 
maan syntaktiseen kokonaisuuteen ja kuinka tiukkaan hän ne osaa tai 
haluaa sitoa toisiinsa. Tekstin eri yksikköjen sidoksisuuden kasvu lisää 
samalla tekstin koherenssia, ja kehityksellisesti koherenssin lisääntymi- 
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nen on erityisen mielenkiintoista (ks. esimerkiksi Berman & Verhoeven 
2002; Givén 2020). Koherenssia lisää muun muassa se, että useita ta- 
pahtumia suhteutetaan toisiinsa. Esimerkissä 11a kyse voi olla samanai- 
kaisista tai mahdollisesti eriaikaisistakin tapahtumista, tapahtumajär- 
jestystä ilmaisevan ikonisuuden kannalta kyse voisi olla peräkkäisistä 
tapahtumista. Esimerkissä 11b kyse on ainoastaan peräkkäisistä. Siten 
11b on koherentimpi kuin ria ja antaa lukijalle vähemmän tulkinnan- 
varaa. Fi olekaan yllättävää, että syntaktisesti kiinteämmin kontekstiinsa 
sidottu rakenne on lukijan kannalta myös helpompi (eli nopeampi) pro- 
sessoida kuin vastaava irrallisempi rakenne (ks. Hyönä & Vainio 2001). 
Nuorilla kirjoittajilla tapahtumien aikasuhteen ilmaisu ei tosin välttä- 
mättä aina onnistu. Tekstin koherenssia lisää myös samasta henkilöstä 
pidempään kertominen, mikä näkyy esimerkiksi samaan viittaavien 
referentiaalisten ketjujen pitenemisenä (ks. tässä teoksessa Kouvon ja 
muiden analyysiä; Givön 1983). 


11a) Söin ja tein töitä. 
11b) Syötyäni tein töitä. 


T-yksiköt on laskettu alakoulun ja yläkoulun viimeisiltä luokilta eli 
kuudennelta ja yhdeksänneltä sekä nuorten aikuisten ryhmästä. Ala- 
koulun muut luokat on sivuutettu, koska nuorimpien aineistossa on 
niin paljon lauseenmuodostusongelmia. Kuudensien aineistossa on 314, 
yhdeksänsien aineistossa 160 ja nuorten aikuisten aineistossa 340 kir- 
joitelmaa. T-yksikköjä on aineistossa kaikkiaan 22 683 ja sanoja niissä 
yhteensä 155 017. Kuudesluokkalaisilla on kirjoitelmissaan keskimäärin 
20 T-yksikköä, tytöillä enemmän kuin pojilla, ja yhdeksäsluokkalaisilla 
22. Nuorilla aikuisilla T-yksikköjen määrä vaihtelee 30-40. Siten paitsi 
sanamäärät myös T-yksikköjen määrä nousee kehityksellisesti. Suurin 
osa peruskoulun pojista kirjoittaa 10-20 T-yksikön kirjoitelmia mutta 
huomattava osa vain alle kymmenen (ks. taulukko 57). Peruskoulun ty- 
töistä kolmannes kirjoittaa 10-20 ja toinen kolmannes 20-30 T-yksik- 
köä kirjoitelmaansa, joten ero vastaavan ikäisiin poikiin on selvä. Ai- 
kuisilla miehillä yleisin luokka on 30-40, naisilla T-yksikköjen määrä 
hajaantuu enemmän kuin miehillä. 
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Taulukko 57. T-yksikköjen määrä Unelmakirjoitelmissa. 


Tkäluokka / Alle 10 10-19 20-29 30-39 40-49 —5otai yli 
T-yksikköluokat % 

Kuudes F 5 29,4 28,7 20,6 10,0 6,3 
Kuudes M 31,6 36,8 17,8 8,6 2,6 2,6 
Yhdeksäs F 6,8 26,1 32,9 14,8 12,5 6,8 
Yhdeksäs M 19,4 34,7 27,8 9,7 4,2 4,2 
Aikuiset F 0,4 3,7 23,3 36,6 29,2 6,6 
Aikuiset M o 6,2 17,5 43,3 21,6 11,3 


Sukupuolen vaikutus kirjoitelmien kokonaissanamääriin, kuten jo edel- 
lä tuli ilmi, ja vielä T-yksikköjenkin määriin on suuri mutta T-yksikkö- 
jen sanamäärä vaihtelee sukupuolen mukaan vähemmän. Keskipituus 
(= MLTU) nousee hitaasti iän myötä: kuudesluokkalaisilla on keskimäärin 
6,3 sanaa yhdessä yksikössä, yhdeksäsluokkalaisilla 6,6 ja nuorilla aikui- 
silla 7,6. Nuorimmilla on jopa 3-4 sanan T-yksikköjä, aikuisilla nämä ovat 
vähissä (ks. taulukko 58). Viiden sanan T-yksiköt vähenevät iän mukaan 
kehityksellisesti ja 6-8 sanan lisääntyvät. Peruskoululaisilla yleisin kes- 
kipituus on viisi sanaa, nuorilla aikuisilla seitsemän sanaa. Kirjoitelmat, 
joissa T-yksiköt ovat hyvin lyhyitä (keskimäärin kolme tai neljä sanaa), 
ovat tyypillisiä kuudesluokkalaisille ja yhdeksännen pojille. Hyvin pitkiä 
(9-10 sanaa) on etenkin aikuisilla miehillä: lähes kolmanneksessa mies- 
ten kirjoitelmista keskisanapituus on yhdeksän tai enemmän. T-yksikön 
sanamäärää voi selittää toisaalta rakenteellisella kompleksisuudella (pal- 
jon alisteisia rakenteita), toisaalta kuvailevuudella, runsaalla ajallispaikal- 
lisella kehystämisellä ja niin edelleen. MLTU ja kompleksisuusindeksi 
korreloivat vahvasti, kuten Pajunen ja Vainio loppuluvussa osoittavat. 


Taulukko 58. T-yksiköiden keskipituus (MLTU) sanoina Unelmakirjoitelmissa. 


Tkäluokka / 3 4 5 6 7 8 9 Io tai enemmän 
MLTU-luokat % sanaa 

Kuudes F 1,2 14,4 33,8 27,5 12,5 5,6 3,1 1,9 
Kuudes M 1,3 17,7 30,3 21,7 15,1 5,9 2,6 5,3 
Yhdeksäs F TI 7,9 29,5 23,9 170 12,5 6,8 11 
Yhdeksäs M o 19,4 26,4 20,8 13,9 12,5 2,8 4,2 
Aikuiset F o 1,7 10,4 25,8 27,9 16,6 8,3 9,1 
Aikuiset M o 2,1 10,3 18,5 24,7 16,5 144 13,4 
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Unelmakirjoitelmien tuloksia voi verrata lehtitekstiin, vaikka koodaus 
ei olekaan taysin samanlainen. Savon Sanomien korpuksessa sanat on 
jaoteltu virkkeisiin, ei T-yksiköihin, jolloin muun muassa rinnasteiset 
lauseet (Pekka söi ja Matti nukkui) kuuluvat samaan yksikköön. Eroilla 
saattaa olla virkkeiden sanamääriin nostava vaikutus. Näin laskettuna 
Savon Sanomien miljoonan sanan otoksessa on yli 80 000 virkettä ja 
virkkeen keskimääräinen sanamäärä on 11,8 (mediaani on 11 ja keski- 
hajonta 6,8). Ero aikuiskirjoittajiin on noin neljä sanaa. Ero käy selvim- 
min ilmi kumulatiivisista prosenteista. Naiskirjoittajilla sanamäärä 3-9 
kattaa T-yksiköistä 91 prosenttia iän mukaan laskien, mutta Savon Sa- 
nomissa vastaava sanamäärä kattaa virkkeistä vain 41,6 prosenttia. Ero 
on niin suuri, että se on merkityksellinen, vaikka laskukriteerit vaikut- 
taisivatkin lukuihin. Ero tarkoittaa, että lehtitekstin kompleksisuus on 
sekä lauseke- että lausetasolla huomattavasti korkeampi kuin Unelma- 
kirjoittajilla. Ero liittyy paitsi tekstin ja sisältöjen luonteeseen, myös kir- 
joittajan kokeneisuuteen. 


KOMPLEKSISUUSINDEKSI 

Kompleksisuusindeksi mittaa kielenkäyttäjän kykyä tiivistää sanomaan- 
sa yhteen rakenteelliseen yksikköön ja samalla kykyä painottaa tapahtu- 
mien keskinäistä tärkeyttä ja arvioida niitä. Kompleksisuusindeksille 
(= CI) saadaan arvo laskemalla kirjoitelman T-yksikköjen ja alisteisten 
rakenteiden määrä yhteen ja jakamalla saatu luku T-yksikköjen määrällä 
(ks. Schneider ja muut 2005). Jos indeksi on lähellä yhtä, kirjoitelman 
kompleksisuus on hyvin matala ja teksti etenee päälausein. Jos indeksi 
lähenee kahta, keskimäärin joka T-yksikössä on yksi alisteinen rakenne 
ja kompleksisuus on verrattain korkea. Indeksi vaihtelee Unelma-aineis- 
tossa tyypillisimmin 1,5—1,7, kuudennen mediaani on 1,53, yhdeksännen 
1,58 ja aikuisilla 1,65-1,7. Matalin arvo on yksi ja tällaisessa tekstissä ei 
siis ole alisteisia lauseita mutta ei myöskään infinitiivejä. Korkein arvo 
on yli kolme. Kompleksisuus vaihtelee sekä kirjoittajien iän että suku- 
puolen mukaan, mikä näkyy selvästi, kun Unelmakirjoitelmat jaotellaan 
kompleksisuusluokkiin (ks. taulukko 59). Hyvin korkeat arvot ovat poik- 
keuksellisia ainakin kertovassa tekstissä. 
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Taulukko 59. Kompleksisuusindeksin arvot luokittain Unelmakirjoitelmissa. 


Tkäluokka / I-1,19 1,2-1,39 14-159 1,6-1,74 1,75-1,99 2 taiyli 
CI-luokat % 

Kuudes F 3,7 26,2 24,4 19,4 15,0 11,2 
Kuudes M 8,5 19,1 25,0 17,1 14,5 15,8 
Yhdeksäs F 3,4 14,8 34,1 15,9 15,9 15,9 
Yhdeksäs M 4,2 15,3 34,7 15,3 19,4 ILI 
Aikuiset F o 11,6 30,0 23,7 18,3 16,2 
Aikuiset M 1,0 6,2 18,5 28,8 25,8 19,6 


Peruskoululaisilla on kirjoitelmissaan hyvin matalia kompleksisuusarvo- 
ja jonkin verran, eniten kuudennen luokan pojilla. Kuudennen luokan 
tytöistä neljännes käyttää melko puhutun kielen mukaista rakennetta. 
Aineistossa kuudennen luokan tyttöjen sekä aikuismiesten kirjoitelmia 
lukuun ottamatta yleisin on rakennetyyppi, jossa joka toinen T-yksikkö 
koostuu päälauseesta ja sille alisteisesta rakenteesta, joka toinen pelkäs- 
tä päälauseesta. Kompleksisemmissa rakenteissa alkaa aikuisten kir- 
joitelmien osuus nousta. Erityisesti aikuisten miesten kirjoitelmille on 
ominaista korkea kompleksisuus. Sanomalehtikielestä ei ole varmoja 
vertailutietoja, mutta Savon Sanomien miljoonan sanan otoksesta las- 
kelmia voi yrittää tehdä. Silloin kyllä joutuu turvautumaan virkemääriin, 
jättämään rinnasteiset lauseet luvuista ja jossain määrin arvioimaan 
myös lauseenvastikkeiden määriä. Sitaatteja ei ole mahdollista huomioi- 
da. Näillä varauksilla kompleksisuusindeksi nousee lehtikielessä 1,8:aan. 
Voi olettaa, että todennäköisimmin lehtikielen joka virkkeessä on jokin 
alisteinen elementti. 

Kompleksisuuseroille on mitä ilmeisimmin monia syitä. Näyttää en- 
sinnäkin siltä, että miesten Unelmakirjoitelmissa pyritään eritteleväm- 
pään kerrontaan, monissa aineiston kirjoitelmissa naiset enemmän ker- 
tovat ja kuvailevat kuin erittelevät. Erittelevässä, argumentoivassa teks- 
tissä indeksi on korkeampi (ks. Berman & Verhoeven 2002, 35; Jagaiah 
ja muut 2020, 2595-2596). Toiseksi miesten kirjoitelmille on ominaista 
ilmaista vähemmän tärkeät asiat taustalla (eli käyttää lauseenvastikkeita), 
naisten kirjoitelmissa käytetään enemmän rakenteeltaan yksinkertaisia 
T-yksikköjä. Kolmanneksi miesten kirjoitelmissa käytetään useammin 
eräänlaista tapahtumajärjestyksen mukaista rytmittämistä: menen syö- 
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mään — syötyäni menen ulkoilemaan — ulkoiltuani lähden nukkumaan. 
Naisten kirjoitelmissa jätetään tapahtumajärjestys useammin pääteltä- 
väksi; tällainen teksti ei silti ole ilman koherenssia, koska koherenssi 
voi rakentua tapahtumien luonnolliseen tai loogiseen aikajärjestykseen. 
Lukijalle etenkin kausaalisuhteiden merkitsemättömyys on silti haaste. 
Tosiasiassa tietysti sekä miesten että naisten kirjoitelmissa käytetään 
molempia kyseisiä kirjoittamisstrategioita mutta eri yleisyydellä. Nais- 
kirjoittajien kirjoitelmat ovat T-yksikköinä laskettuna hieman pidempiä 
kuin miesten, mutta koska kompleksisuuden ja T-yksikköjen määrä 
korreloi negatiivisesti, miesten tekstit ovat keskimäärin syntaktisesti 
tiiviimpiä kuin naisten. 

Esimerkit 12-15 havainnollistavat mittarein kuvattua tyyppien eroa erit- 
televästä kerronnasta (12) kuvailevaan (13) ja toisaalta tapahtumien suh- 
teita tarkasti ilmaisevaan (14) vs. ilmaisemattomaan (15) kerrontaan. Esi- 
merkki 15 edustaa yksinkertaista rakennetta, jossa lukijan tehtäväksi jää 
päätellä tapahtumien keskinäiset suhteet. Esimerkit ovat yhdeksänneltä 
luokalta. Ohimennen todettakoon, että esimerkki 12 on erittelevyydessään 
poikkeus Unelmakirjoitelmissa. Aikuisaineiston esimerkit 16-17 osoitta- 
vat, että kirjoitelman luonteeseen vaikuttaa risteäviä tekijöitä, joten yksit- 
täinen arvo ei aina ole riittävän informatiivinen. Asian selventämiseksi 
onkin syytä erikseen tutkia myös kompleksisuustekijöitä tarkemmin. 


Frittelevä teksti, MLTU = 7,88, CI = 1,72: 

12) Päivä sekoitetaan usein vuorokauteen. Päivä ei kuitenkaan ole 
ajanjakso joka käsittää 24 tuntia, vaan matka aamusta iltaan, aurin- 
gonnoususta auringonlaskuun. Mikä taasen on unelmaa? No, oma 
mielipiteeni asiaan: unelma — haave, toive, miltein unen omainen. 
Unelmieni päivä, mitä tämä konteksti voisi käsittää? Päivä josta unek- 
sin, vai päivä jona unelmoidaan. (9M50) 


Kertova ja kuvaileva teksti, MLTU = 6,17, CI = 1,34: 

13) Aamulla herään valoon. Ulkoa kuuluu viserrystä, mutta talossa on 
hiljaista. Äiti ei ole vielä herännyt, hyvä niin, tämä päivä olisi minun. 
Astun ulos ja lempeä tuuli toivottaa minut tervetulleeksi ulkoilmaan. 
Naapuritkaan eivät ole vielä heränneet, — —. (9F65) 
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Rakenteeltaan kompleksinen teksti, MLTU = 5,83, CI = 1,87: 
14) Kun herdsin kuulin laineiden liplattavan ja aaltojen kuohahta- 
misen niiden osuessa rantakivikkoon. Avasin silmäni ja näin lokkien 
kaartelevan yläpuolellani. Nousin ylös ja huomasin olevani hiekkaran- 
nalla, joka loppui toisella puolella kivikkoon. Päästyäni ylös lähdin kä- 
velemään rantaa pitkin löytääkseni syötävää nälkääni. (9M147) 


Rakenteeltaan yksinkertainen teksti, MLTU = 4,67, CI = 1,14: 

15) On aamu hotelli Presidentissä. Auringon säteet pyrkivät huonee- 
seeni sälekaihtimien väleistä. Olen juuri herännyt suureen päivään. 
Huonekaverini ovat jo ylhäällä. Tänään se tapahtuu, mistä olen aina 
haaveillut. Se on salibandyn MM-finaali. En voi uskoa tätä todeksi, 
mutta totta se on. Kotiyleisön edessä täydellä Hartwall areenalla, ja 
Ruotsi vastassa. Huippua! (9F103) 


Korkea NTVR (63,3), korkea leksikaalinen tiheys (81), korkea 
CI (1,73) ja korkea MLTU (8,1): 

16) Saapuessani treenikämpän pihaan minut havahduttaa ajatuksista- 
ni tuttu, hieman katkeran kuuloinen ääni: ”Jaahas, jaksaisikohan ar- 
von kitarataiteilija roudata tänään edes omat soittokamppeensa au- 
toon? Me ollaan täällä jo kaikki muu roudattu.” ”No jos nyt sitten 
tämän kerran”, vastaan laiskasti hymyillen ja retuutan kaiutinkaappi- 
ni suurieleisesti ähisten auton takakonttiin. (PääsyM 46) 


Korkeahko NTVR (58,4), korkea leksikaalinen tiheys (85,4), matala 
Cl-arvo (1,1) ja MLTU (4,2): 

17) Varpuset visertävät. Auringon luomat säteet tuovat hohkaavaa läm- 
pöä iholle. Raotan varovaisesti silmiäni tähän kauniiseen aamuun. 
Omenapuiden tuoksu takapihalla monenkirjavien pudonneiden lehtien 
ympärillä huumaa mielen. Otan varovaisen hörpyn Earl Grey -teetä 
ja avaan sanomalehden ensimmäisen sivun. ”Ihanaa”, tuumin. Päivä 
koittaa. Käyn suihkussa ja höylään partani. (PääsyM166) 
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Lopuksi 


Keskeinen kehityksellinen trendi kirjoittamisessa on yksinkertaisesta 
kompleksiin. Trendi ilmaisee samalla kehitysta kielenhallinnassa. Ra- 
kenteen tasolla kyse on siitä, että sanat, lausekkeet ja lauseet pitenevät ja 
niiden monimuotoisuus lisääntyy, tekstin tasolla sanamäärä kasvaa. Ky- 
seinen trendi heijastuu monien kielenyksiköiden kautta, osin risteävästi 
tyylillisen kehityksen kanssa. Tyyliä voi tutkia vain holistisesti arvioimal- 
la, mutta siihen ei ole yksiselitteisiä, kaikkien hyväksymiä kriteerejä. 
Toinen ongelma on, että kompleksisuus kasvaa kehityksellisesti, mutta 
kompleksisin rakenne ei välttämättä ole paras. Fi ole tutkittua tietoa 
siitä, mikä on kehityksellisen kompleksisuuden ja vaikkapa tyylittelevän 
pelkistyksen suhde. Kun miehet ja naiset kirjoittavat kompleksisuudel- 
taan erilaista tekstiä, kyse voi olla monesta asiasta, esimerkiksi erilaisesta 
suhtautumisesta ohjeistukseen; ylioppilaskirjoituksiin valmentautuvia- 
han usein kehotetaan välttämään kompleksisia rakenteita esimerkiksi 
epäonnistumisvaaran vuoksi." Tyydymme tässä yhteydessä kokoamaan 
analyysin keskeiset tulokset, ja jatkamme kompleksisuuden ongelman 
arvioimista tämän teoksen loppuluvussa. 

Sanapituudet kasvavat kehityksellisesti ja tarjoavat nopean keinon ar- 
vioida ikätaso ja tekstityyppi huomioiden kirjoitelman kompleksisuutta. 
Esimerkiksi tämän luvun keskimääräinen sanapituus on 7,6, mikä ylit- 
tää kirjoitelmien aikuiskirjoittajan keskiarvon mutta vastaa suunnilleen 
sanomalehtikeskiarvoa. Sanapituus viittaa argumentoivaan, erittelevään 
ja melko kompleksiin tekstiin. Alakouluikäisillä kirjoittajilla keskiarvo 
on 6, ja se nousee hitaasti peruskoulun loppuun mennessä 6,5:een, ai- 
kuiskirjoittajilla keskiarvo on 7. Jos samassa kertovassa tms. tekstissä kir- 
joittaja jää selvästi alle ikäluokkansa keskiarvon, tilannetta pitää arvioi- 
da tarkemmin. Myös sanarakenteet kompleksistuvat kehityksellisesti, 
ja tämä näkyy erityisen hyvin johdosten määrän kasvusta. Nuorimmilla 
kirjoittajilla johdosten esiintymämäärä kaikista sanoista on 10 prosent- 
tia, yhdeksäsluokkalaisilla 15 prosenttia ja nuorilla aikuisilla 20 prosent- 
tia. Kun sanamäärä aineistossa on yli 200 000, erot ovat tilastollisesti 


119 Tieto on peräisin suomen kielen opiskelijoilta. 
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hyvin merkitseviä. Johdokset tuovat tekstiin spesifejä merkityksiä. Yh- 
dyssanojen määrässä ei vastaavaa kehitystä tapahdu, vaikka yhdyssano- 
jen laatu muuttuu kehityksellisesti. 

Leksikaaliset indeksit ovat hyvin tekstityyppiriippuvaisia. Kertovassa 
tekstissä NTVR eli substantiivi-verbi-indeksi on lapsilla 1:1 ja nousee 
nuorilla aikuisilla 1,1:1:een. Kertovassa tekstissä indeksi on siis odotuk- 
sen mukaisesti melko matala. Leksikaalinen tiheys on synteettisessä 
suomen kielessä korkea, koska itsenäiset sanat eivät ilmaise kieliopil- 
lisia merkityksiä vaan taivutus. Kertovassa tekstissä tiheys on kaiken 
ikäisillä 75-80 prosenttia kokonaissanamäärästä. Frittelevän tekstin 
leksikaalinen tiheys on jonkin verran korkeampi. Lapsilla keskiarvo on 
75 prosenttia, aikuisilla 77 prosenttia eli ero on pieni. Taas on kuiten- 
kin todettava, että tarina on lasten ja aikuisten osalta erilainen. Lapsilla 
leksikaalinen tiheys on korkea, mutta kuten Pajunen ja Honko tämän 
teoksen toisessa luvussa osoittavat, se ei ole yhteydessä esimerkiksi lek- 
sikaaliseen diversiteettin, yhdeksäsluokkalaisilla tiheys ja diversiteetti 
alkavat nousta yhdessä ja aikuisilla yhteys on hyvin selvä. Toisin sanoen 
aikuisilla on sitä enemmän eri lekseemejä, mitä korkeampi leksikaalis- 
ten sanaluokkien osuus on tekstimassasta. Siten aikuisteksteissä kor- 
kea leksikaalinen tiheys osoittaa tekstin olevan informaatiopitoista ja 
semanttisesti rikasta, mutta lapsilla on teksteissään toisteisuutta. 

Syntaktinen tiheys niin ikään kasvaa kehityksellisesti. Sitä mittasim- 
me T-yksikköjen keskipituuden (MLTU) ja lauserakenteen kompleksi- 
suusindeksin avulla. MLTU:n mediaani on kuudesluokkalaisilla 6 sa- 
naa, yhdeksäsluokkalaisilla 6,2 ja aikuisilla 7,4. Kuudesluokkalaisten 
T-yksiköissä on keskimäärin 1,5 lausetta, yhdeksäsluokkalaisilla 1,58 ja 
aikuisilla 1,67. Lauserakenteen kompleksistuminen tarkoittaa informaa- 
tion tiiviimpää esittämistä ja sitä nostavat esimerkiksi sivulauseet ja in- 
finiittiset rakenteet. Sivulauseista nominaaliset viittaavat evaluoinnin 
lisääntymiseen, relatiiviset muun muassa tarkempaan diskurssientiteet- 
tien kuvaukseen sekä adverbiaaliset ajan, ehtojen ja syiden esittämiseen. 

Kaikkia annettuja keskiarvolukuja voidaan käyttää ikäkausitason ar- 
vioinnissa, toiset luvut vain ovat helpompia tavoittaa kuin toiset. Esi- 
merkiksi leksikaalisen indeksin laskeminen edellyttää tarkkaa sana- 
luokka-analyysiä, mutta sanapituuskeskiarvot on helppo laskea tekstin- 
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käsittelyohjelmalla. Kokemus kuitenkin opettaa arvioimaan. Esimerkiksi 
johtamattomien ja johdettujen sanojen suhdetta on melko helppo tark- 
kailla. Vastaavasti voi opetella arvioimaan keskiarvojen taustatekijöitä 
eri ikäryhmissä. Esimerkiksi kompleksisuusindeksiin vaikuttavien infi- 
niittisten muotojen puuttuminen on lapsilla kehityksellinen ongelma, 
aikuisilla taas yksinkertaisen rakenteen suosimisen merkki. Hyvin yk- 
sinkertainen tai hyvin kompleksinen tyyli edustavat molemmat syntak- 
tisesti yksipuolista tyyliä (vrt. Beers & Nagy 2009, 187). 

Myös sanamäärä kasvaa kehityksellisesti ja tasaisesti. Sanamäärää 
mittasimme sekä kirjoitelmien kokonaissanamääränä että T-yksikköjen 
määränä. Sanamäärä on yleisesti käytetty kehitysmittari mutta monella 
tavalla ongelmallinen: Se riippuu tehtävästä, tehtävänannosta, tekstin 
luonteesta ja ennen kaikkea kirjoittajan motivaatiosta ja pystyvyysuskos- 
ta. Ongelmallisinta on kuitenkin, että tekstin kompleksisuus ja tiiviys 
laskee sekä kokonaissanamääriä että T-yksiköiden määriä. Toisin sanoen 
lattea, kehityksellisesti ikään kuin heikompi rakenne tuottaa enemmän 
sanoja kuin kehityksellisesti parempi, kompleksinen rakenne (vrt. Mu- 
honen 2019).”° Sanamäärämittari ei myöskään huomioi tekstin kohe- 
renttiutta. Suurin ongelma on, että sanamäärä mittarina suosii tyttöjä, 
joille tuottaminen sinänsä on helppoa; naisten prosessointinopeus on 
keskimäärin miehiä nopeampaa älykkyydeltään vertaistetussa aineis- 
tossa ja se näkyy sekä lukemisessa että kirjoittamisessa (ks. Caramata & 
Woodcock 2006; Keith, Reynolds, Patel ja Ridley 2008; Beal, Holdnack, 
Saklofske & Weiss 2016). 

Kirjoittamisen sukupuolierot ovatkin selvät tyttöjen hyväksi, jos arvio 
perustuu yksin sanamääriin. Tytöt myös saavuttavat kertomusrakenteen 
konventiot poikia aikaisemmin, kehitys toisin sanoen kulkee eriaikaises- 
ti. NTVR ja leksikaalinen tiheys sekä johdosten määrät eivät eroa sanot- 
tavasti sukupuolen mukaan. MLTU ja kompleksisuusindeksi ovat mies- 
puolisilla kirjoittajilla hieman korkeammat kuin naispuolisilla, ja monet 
mieskirjoittajat suosivat kompleksista tyyliä. On tutkimustuloksia, joi- 
den mukaan MLTU ja kompleksisuusindeksi ovat korkeampia juuri 


120 On mielenkiintoista, että Nieminen (2007) sai jo 2—3-vuotiaiden lasten syntaktisen rakenteen arvioin- 
nissa esiin pituuden ja kompleksisuuden käänteisen suhteen. 


KIELEN RAKENTEEN HALLINTA PERUSKOULULAISILLA JA NUORILLA AIKUISILLA 413 


https://doi.org/10.21435/skst.1472 


niillä opiskelijoilla, joiden koulumenestys on parempi (vrt. Truckenmil- 
ler & Petscher 2020), mutta toisaalta syntaktisen kompleksisuuden ja 
laadun välistä yhteyttä pidetään inkonsistenttina (Beers & Nagy 2009, 
189-190). On myös mahdollista, että suhde ei ole inkonsistentti vaan 
riippuvainen iästä ja tekstin tyypistä (Crowhurst 1980) tai että se on vain 
viitteellinen (Crowhurst 1980; 1983). 

Toinen kehityksellinen trendi, joka näkyy koehenkilökohtaisessa tar- 
kastelussa jokaisen tarkastellun rakenneyksikön osalta, on ikäluokka- 
kohtaisen hajonnan kaventuminen. Nuoremmilla mittarien arvojen 
hajonta on aina suurempi kuin vanhemmilla, vaikka monen mittarin 
osalta on luonnollista, että hajontaa on hieman. Mittarin ääriarvot viit- 
taavat ongelmiin, ikäluokan keskiarvolukujen ympärillä pyörivät arvot 
taas viittaavat ennemmin tekstinrakentamisen keinojen eroihin. Koulu- 
tuksen tehtävä on vähentää ikäluokittain näkyviin tulevaa suurta hajon- 
taa aivan samalla tavalla kuin sen pitäisi saada aikaan ikäkausittain tasai- 
sesti nouseva muutos tekstitaidoissa. Esimerkiksi monen mittarin arvot 
eivät eroa kuudesluokkalaisten ja yhdeksäsluokkalaisten poikien välillä, 
vaikka tyttöjen kehitys on tasaisesti etenevää. Tämän ”suoran viivan” 
täytyy olla koulun — opetussuunnitelmien, kouluviranomaisten ja viime 
kädessä yhteiskunnan — ongelma, ei pelkästään itse poikien. Erot eivät 
näet selity kielellisen älykkyyden eroilla. 
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Johdanto 


Syntaktisen rakenteen kehitystä tarkastellaan tyypillisesti sen tiivistymi- 
sen näkökulmasta. Tiivistyminen tarkoittaa, että asioiden väliset suhteet 
esitetään siten, että painotetaan enemmän relevantteja kuin irrelevant- 
teja tekijöitä, tapahtumia ei aina esitetä tapahtumajärjestyksen vaan esi- 
merkiksi tärkeysjärjestyksen mukaan, pohditaan asioiden välisiä syy- 
seuraussuhteita, arvioidaan tapahtumia ja niin edelleen (ks. esimerkiksi 
Beers & Nagy 2011). Tiivistäminen heijastuu syntaktiseen rakenteeseen 
ja näkyy muun muassa rakenteellisen hierarkian ja sanamäärien kasvus- 
ta. Kielellisesti se ilmaistaan käyttämällä nominalisaatiota, monijäseni- 
siä lausekkeita, sivulauseita, lauseenvastikkeita ja infiniittisiä rakenteita, 
toisin sanoen rakenteita, jotka ovat ominaisia kirjoitetulle kielelle ja joita 
rakenteeltaan yksinkertaisemmassa puhutussa kielessä käytetään vähem- 
män. Nämä rakenteelliset keinot opitaan hallitsemaan kehityksellisesti, 
ja niiden monipuolinen hallintaan saaminen kestää useimmilla aikui- 
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suuteen. Tiivistyminen ja sen mukanaan tuoma rakenteen kerroksisuus 
eli kompleksisuus on huomioitava paitsi kehityksellisessä tutkimuksessa 
myös, kun tutkitaan kielen oppimista (ks. Lu 2009), lukemista ja kir- 
joittamista (ks. esimerkiksi Leikin & Assayag Bouskila 2004; Nippold, 
Hesketh, Duthie & Mansfield 2005; Nippold, Mansfield & Billow 2007), 
kielen ymmärtämis- ja tuottamisprosesseja (ks. Demberg & Keller 2008; 
Scontras, Badecker, Shank, Lim & Fedorenko 2014) tai kun laaditaan ar- 
viointikriteerejä (vrt. Graesser, McNamara & Kulikowich 2011). Komplek- 
sisuus huomioidaan tyypillisesti myös tekstien vaikeutta arvioitaessa. 

Kompleksisuutta käsitellään kirjallisuudessa monessa yhteydessä ja 
määrittelystä ei ole yksimielisyyttä (ks. esimerkiksi Givön 1991; Dahl 
2004; Itkonen 2009). Kompleksisuudesta voidaan puhua myös monen 
eri tason ilmiönä, niin sana-, lauseke-, lause- kuin tekstitason ilmiönä, 
ja esimerkiksi termejä syntaktinen, kognitiivinen, lingvistinen ja raken- 
teellinen kompleksisuus voidaan käyttää lähes synonyymeinä (ks. 
Szmrecsanyi 2004). Kompleksisuutta ei siten ole yksiselitteistä opera- 
tionalisoida. Givön (2009, 3) määrittelee kompleksisuuden organisoitu- 
neiden entiteettien ominaisuudeksi, jolloin kompleksisuus nähdään 
asteikollisena, lähtökohtana esimerkiksi juuri peruslausetaso. Raken- 
teen eli objektiivisen kompleksisuuden kannalta kriteerinä voi olla paitsi 
lauserakenteiden tiivistyminen myös niiden ei-lineaarisuus. Komplek- 
sinen (lause)rakenne on se, joka ei koostu pelkästään peruslauseen eli 
intransitiivi-, transitiivi- tai kopulalauseen predikaatista ja sen argumen- 
teista, ja ei-lineaarisia ovat esimerkiksi sisäkkäiset rakenteet. Toimijaan 
suhteutuvaa kompleksisuutta (agent related) voidaan arvioida oppimisen 
tai ymmärtämisen tuottamasta vaivasta. 

On tärkeä ymmärtää, että objektiivinen ja toimijaan suhteutuva komp- 
leksisuus eivät ole suorassa suhteessa toisiinsa." Siksi sellaiset ennakko- 
oletukset kuin ”vähempi on helpompi” tai ”selkeästi ajateltu on selkeästi 
ilmaistu” ovat ongelmallisia. Oletetaan esimerkiksi, että rakenne, jossa 
on vähän kieliopillista merkintää ja lyhyet lauseet ja sanat, on yksin- 
kertainen (= ei-kompleksinen), mutta samalla oletetaan, että tämä sama 


121 Esimerkiksi Lapp, Moss, Grant & Johnson (2015) käsittelevät kompleksisuutta monipuolisesti koulu- 
kontekstissa sekä opettamisen että opiskeluvalmiuksien kannalta. 
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rakenne on helppo tuottaa tai ymmärtää. Prosessointitutkimus on 
osoittanut, että on oikeasti vaativaa, jos tekstistä puuttuu koherenssin 
ilmimerkintä ja jos lukija joutuu itse tekstin koherenssin päättelemään. 
Itkosen (2010, 9) mukaan parataktisten lauseiden S1 ja S2 suhde voi 
olla peräkkäisyys, seuraamus, samanaikaisuus tai vastakohta, lisäksi 
ne voivat olla ajallisessa, finaalisessa tai alisteisessa suhteessa toisiinsa. 
Nämä kaikki suhteet lukija joutuu päättelemään, jos niitä ei merkitä 
näkyviin. Esimerkiksi McNamaran, Louwersen ja Graesserin (2002, 11) 
mukaan lausepituus — siis lauseen sanamäärä — on lauseiden tai raken- 
teiden kompleksisuusvertailussa ongelmallinen käsite. ”Vähempi on 
helpompi” -periaatehan johtaa siihen, että lyhyt lause tai virke olisi hel- 
pompi ymmärtää kuin pitkä. Esimerkki 1a sisältää kaksi lyhyttä virkettä, 
esimerkki 1b ilmaisee saman asian yhdellä pitkällä virkkeellä, ja jos siis 
sanamäärä sellaisenaan olisi kompleksisuuskriteeri, ra olisi helpompi 
ymmärtää kuin 1b: 


1a) One part of the cloud develops a downdraft. Rain begins to fall. 
1b) One part of the cloud develops a downdraft, which causes rain 
to fall. 


Esimerkissä 1a ei kuitenkaan anneta kielellistä vihjettä lauseiden välises- 
tä kausaalisuhteesta ja lukijan pitää luoda tämä suhde pelkän lauseiden 
läheisyyden perusteella. Esimerkissä tb sana causes toimii kohesiivisena 
lauseiden suhdetta ilmaisevana keinona (ks. McNamara ja muut 2002, 
11). Tämän voi tulkita muun muassa siten, että lausetason kompleksi- 
suus vaikuttaa eri tavoin kuin tekstitason. Toisaalta Hyönä ja Vainio 
(2001) osoittavat suomen osalta, että vaikka saman asiasisällön ilmai- 
sevissa lauseissa molemmissa olisi niiden välisen suhteen ilmaisin (vrt. 
2a ja 2b), lukijan kannalta toinen — ja tässä tapauksessa rakenteellisin 
kriteerein kompleksisemmaksi oletettu — voi olla helpompi (= luetaan 
nopeammin). Eroa selittävät rakenteiden frekvenssierot: esimerkin 2b 


122 Tutkimus on toteutettu silmänliikkeitä mittaamalla. Metodilla päästään kiinni lukijan tiedostamat- 
tomaan prosessointiin eli alemman tason visuaaliseen prosessointiin, vaiheeseen ennen tietoista, 
semanttista prosessointia (ks. esimerkiksi Vainio 2006). 
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konstruktio on suomen kielessä yleisempi kuin esimerkin 2a jotta-lause. 
Temporaalirakenteen ja kun-lauseen suhde on päinvastainen, koska nyt 
kun-lause on paitsi yksinkertaisempi (= vähemmän tiivis) myös yleisempi. 


2a) Jotta uhri toipu/isi, hänen on saatava pikaisesti lisää verta. 
2b) Toipuakseen uhrin on saatava pikaisesti lisää verta. 


Oletus ”selkeästi ajateltu on selkeästi — yksinkertaisesti — ilmaistu” si- 
vuuttaa tekstin abstraktiustason ja asiayhteyden, tuottamisen ja ymmär- 
tämisen sekä vielä lukijan tietotason. Se sitoo asiantuntijan ajattelun 
maallikon ajatteluun väittämällä, että selkeää on vain se, mitä maallikko 
— asiantuntijan oletuksen mukaan — ajattelee ja ymmärtää. Esimerkiksi 
Preiss, Castillo, Flotts ja San Martin (2013) osoittavat, että kirjoittajilla on 
taipumus kirjoittaa vaikeista asioista kompleksisemmin kuin helpoista. 
Nippold toistaa monessa yhteydessä, että sisällön käsitteellinen vaikeus 
näkyy rakenteen kompleksisuutena (ks. esimerkiksi Nippold 2009). 
Lapp, Moss, Grant ja Johnson (2015) erottavat sekä kvantitatiivisen, mi- 
tattavissa olevan että toimijaan suhteutuvan kompleksisuuden mutta 
lisäksi vielä kvalitatiivisen eli sisältöön — käsitteelliseen tasoon - liittyvän 
kompleksisuuden. 

Tutkimme tässä luvussa kehityksellisestä näkökulmasta syntaktisen 
rakenteen tiivistymistä arvioimalla pääasiassa kuudes- ja yhdeksäsluok- 
kalaisten Unelmakirjoitelmia vertailukohtana nuoret aikuiset. Sana- 
luokkakohtaista analyysiä teemme koko peruskoululaisten aineistosta 
eli Koulu- ja Unelmakorpuksista (aineistosta tarkemmin tämän teoksen 
johdannossa). Lisäksi on vertailulukuja sanomalehtikielestä. Rajaamme 
kompleksisuuden rakenteelliseksi (= objektiiviseksi) ja arvioimme toi- 
saalta formatiiveja — kieliopillisesti ilmaistuja merkityksiä — ja erottelem- 
me toisaalta argumenttirakenteen ja sen välttämättömät jäsenet muista. 
Toimijakeskeinen kompleksisuus on osin pääteltävissä formatiivien 
määrän kehityksellisestä noususta ja argumenttirakenteen rikastumi- 
sesta, mutta sitä emme tutki. Unelmakirjoitelmat eivät ole sisällöllisesti 
kovin kompleksisia ja suuri osa on kertovia. Heinosen (2018) mukaan 
kirjoitelmissa käsitellään keskimäärin kolmea aihetta, aiheiden vaihtelu- 
väli on 1-8. Aiheiden määrä laskee iän mukaan, ja kun sanamäärä sa- 
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malla kasvaa, aiheita käsitellään aiempaa perusteellisemmin. On toden- 
näköistä, että tämä näkyy kompleksisuustekijöistä kuten sanaluokka- 
osuuksista. Lisäksi kirjoittajien kehitysaste vaihtelee aineistossa hyvin 
paljon. Tavoite on tuoda kaikki tämä vaihtelu esiin ja samalla osoittaa 
keskimääräinen ikäluokkatasolla hallittu kompleksisuus ja sen osateki- 
jät. Yksilötasolla on mahdollista, että tyylillinen yksinkertaistaminen 
edellyttää kompleksisuuden eri asteiden hallintaa ja että taito tuottaa 
hyvää tekstiä edellyttää koko kielellisen repertuaarin hallintaa. Tätä kehi- 
tystä ei tosin voi todistaa synkronisella aineistolla. 

Määrittelemme ensin keskeiset käsitteet, sitten analysoimme nomi- 
naalisia sanaluokkatekijöitä, jotka voisivat vaikuttaa syntaktisen raken- 
teen tiiviyteen ja sanamääriin. Seuraavaksi vertailemme kompleksisuutta 
nostavia verbaalisia tekijöitä ikäluokittain ja eri kirjoittajilla. Nominaa- 
listen ja verbaalisten sanaluokkatekijöiden analyysi on sekä laadullista 
että yleisyyksiä kuvailevaa — ei varsinaista tilastollista analyysiä —, koska 
aineistona olevissa kirjoitelmissa on tilastoanalyysiä hankaloittavia ris- 
teäviä tekijöitä, esimerkiksi erilaisia tyylillisiä valintoja. Kuvaileva ote on 
välttämätön myös ryhmien sisäisen suuren vaihtelun takia. Yksi tavoite 
onkin tutkia, mitä tästä vaihtelusta voi kompleksisuuden osalta sanoa. 
Lopuksi pohditaan kompleksisuutta kehitykselliseltä kannalta ja kootaan 
tulokset. 


Syntaktisen rakenteen kehityksellinen kompleksisuus 


Syntaktisen rakenteen kompleksisuutta voi arvioida muun muassa 
määrittelemällä yksinkertaisuus negaation kautta: yksinkertainen on 
se, mitä ei voi selvin kriteerein osoittaa kompleksiseksi.' Esimerkiksi 
kieliopillisen merkinnän määrällä (ks. Itkonen 2009, 190-208; Itko- 
nen, Pajunen & Suomi 2009) voidaan erottaa kompleksisemmat yksi- 
köt yksinkertaisemmista: edellisissä merkintää on, jälkimmäisissä ei 


123 Nykyisin kompleksisuutta arvioidaan myös teknisesti tiivistämällä eli ns. kompressiomenetelmällä 
(ks. Sadeniemi, Kettunen, Lindh-Knuutila & Honkela 2008; Ehret & Szmrecsanyi 2016). Tässä mene- 
telmässä ei nähdä laadullisia eroja. 
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ole. Syntaksissa vain pääsanasta koostuva (endosentrinen) lauseke on 
yksinkertainen yksikkö. Vastaavasti yhden predikaation suorittava pe- 
ruslause — intransitiivi- tai transitiivilause —, jossa on vain pakolliset 
argumentit ja yksiosainen finiittinen verbi, on yksinkertainen yksikkö 
(peruslausetyypeistä ks. Itkonen 2008). Yksinkertainen yksinäislause eli 
päälause noudattaa hallitsevan verbin argumenttirakennetta välttämättö- 
mine jäsenineen (ks. Pajunen 2001), kompleksinen rakenne on tästä 
argumenttirakenteeseen kuulumattomin jäsenin rikastettu. Rinnastus 
ja ketjuttaminen on tekstitasolla yksinkertaisempaa kuin alistus: alistus 
on aina merkitty jollain formatiivilla. 

Yksinkertaiset yksiköt ovat yleensä yleisiä, mutta yleisyys on ongel- 
mallinen kriteeri ensinnäkin, koska siitä ei ole etenkään suomen kielen 
osalta tarpeeksi tietoa, ja toiseksi, koska yleisyystekijät vaihtelevat muun 
muassa tekstilajeittain. Myös tuttuus on yksi yleisyystekijä. Äidinkieli- 
sen kielenpuhujan kokemusta rakenteellisesta yleisyydestä, siis subjek- 
tiivista yleisyyttä tai tuttuutta, on tutkittu olemattomasti. Vainio, Paju- 
nen, Hyönä ja Bertham (tulossa) vertailevat kokeellisesti morfologisesti 
yksinkertaisia ja kompleksisia transitiivi- ja intransitiiviverbejä sisältä- 
vien lauseiden prosessointia aikuisilla ja osoittavat, että lukijan kannalta 
(kohteen olotilan muutosta kielentävä) transitiivilause on perustavampi 
— nopeampi prosessoida — kuin vastaava intransitiivilause; ero tosin ei 
ole suuri. Lasten kielenoppimisessa yksinkertaiset, leksikaalisesti rajau- 
tuvat rakenteet ovat ensisijaisia; suuri osa ensiverbeistä on transitiivisia 
(Tomasello 2003; Diessel 2004). Toisaalta intransitiiviverbejä on pidetty 
niin sanottuna semanttisena primitiivinä (keskustelusta ks. esimerkiksi 
Wierzbicka 1980). 

Syntaktisia kompleksisuuskriteereitä ovat siten ainakin lausekkeiden, 
lauseiden tai virkkeiden sanamäärä sekä merkinnän määrää nostava si- 
säinen hierarkkisuus, ei-finiittiset ainekset ja ei-lineaarinen lauseraken- 
ne. Esimerkiksi Szmrecsanyin (2004) mukaan syntaktisen kompleksi- 
suuden mittareina lauseen sanamäärä ja toisaalta NP:n hierarkkinen 
rakenne eli mittarit, joiden työläys analysoijan kannalta on aivan erilai- 
nen, tuottavat kohtuullisen samanlaisia tuloksia; tulos on saatu verrat- 
tain pienellä aineistolla. Beers ja Nagy (2009; 2011) toteavat, että syntak- 
tinen kompleksisuus eriytyy tekstin tyypin mukaan ja että sitä täytyy 
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mitatakin eri tavoin. Kertovien tekstien kompleksisuutta pitäisi mita- 
ta virkkeiden sanamääristä, erittelevien tekstien taas lauseiden sana- 
määristä. Näin eriteltynä syntaktinen kompleksisuus ennustaisi heidän 
mukaansa myös kirjoituksen kehityksellistä tasoa. Beaman (1984, 45) to- 
teaa, että tekstin syntaktinen kompleksisuus suhteutuu alisteisten raken- 
teiden määrään, tyyppiin ja hierarkkiseen syvyyteen ja vastaavasti syn- 
taktisesti yksinkertaisessa tekstissä on enemmän rinnasteisia rakenteita. 
Givön (1991, 347) katsoo, että alisteiset rakenteet viittaavat merkitym- 
piin ja siten kognitiivisesti raskaampiin kategorioihin. Scontras ja muut 
(2014) toteavat, että ei-lokaaliset viittaussuhteet ovat vaativampia tuottaa 
ja prosessoida kuin lokaaliset. Lisäksi ainakin englannissa ei-lokaalisessa 
kontekstissa subjektiin viittaava relatiivipronomini on helpompi proses- 
soida — ja ilmeisesti helpompi tuottaa — kuin objektiin viittaava. 

Oman analyysimme lähtökohtana on edellisen luvun antama tieto 
siitä, että peruskoululaisten kirjoitelmissa sekä virkkeisiin vertautuvien 
T-yksiköiden sanamäärä (= MLTU eli mean lenght of terminal units) että 
lauserakenteiden tiiviys (= CI eli kompleksisuusindeksi) kasvavat. Ta- 
voitteemme on arvioida kompleksisuuden osatekijöitä ja sen vaihtelua 
tarkemmin: mistä aineksista kompleksisuus kulloinkin koostuu ja mitä 
niistä voi päätellä. Keskitymme kuudes- ja yhdeksäsluokkaisten kirjoitel- 
miin mutta kehitystrendejä osoittaaksemme otamme erityisesti sana- 
luokkatasolla huomioon myös muita peruskoululaisia. Vertailukohtana 
ovat ylioppilastutkinnon suorittaneet nuoret aikuiset. Fi kuitenkaan ole 
syytä ajatella, että kehitykselliset trendit sellaisenaan osoittavat esimer- 
kiksi, mikä aikuisen lukijan kannalta on helppoa, mikä vaikeata (vrt. 
Taylor, Greenberg, Laures-Gore & Wise 2012). Emme myöskään tässä 
yhteydessä puutu varsinaisesti tekstien rakenteeseen, mikä edellyttäisi 
muun muassa globaalikoherenssin tutkimista. 

Keskitymme virkettä muistuttaviin T-yksiköihin ja selvitämme niiden 
koostumusta ikäkausittain ja kehityksellisesti. T-yksikkö koostuu ole- 
tuksen mukaan suhteessa kontekstiin itsenäisestä yksinäislauseesta ja 
siihen liittyvistä finiittisistä ja ei-finiittisistä aineksista, jotka on merkitty 
alisteisiksi käyttäen alistuskonjunktioita tai relatiivi- ja interrogatiivi- 
pronomineja sekä ei-finiittisiä aineksia (T-yksiköistä ks. Schneider, Vis 
Dub6 & Hayward 2005). Myös lausemuotoiset suorat ja epäsuorat lainat 


SYNTAKTISTA RAKENNETTA TIIVISTÄVÄT JA KOMPLEKSISTAVAT TEKIJÄT ... 427 


https://doi.org/10.21435/skst.1472 


lasketaan alisteisiksi. Substantivoituja verbejä, kuten minen-johdoksia, 
ei huomioida, vaikka niiden määrä kasvaa kehityksellisesti, koska luku- 
määrä sinänsä on pieni. T-yksikkö on aina kirjoittajan hierarkkiseksi 
kokonaisuudeksi merkitsemä yksikkö, ja se ei voi koostua löysästi ketjut- 
tuvista lauseista. Siten T-yksikkö on virkettä kehityksellisempi yksikkö, 
koska sen tuottajan pitää suunnitella yksikkö tiettyä merkitystä ilmaise- 
vaksi kokonaisuudeksi. T-yksiköistä on laskettu koehenkilökohtaisesti 
niin keskipituus sanoina (MLTU) kuin kompleksisuusindeksi (CI eli 
alisteisten yksikköjen suhde T-yksilöiden kokonaismäärään). 

Syntaktisen rakenteen kehityksellinen kompleksistuminen ilmenee 
T-yksiköiden keskipituuden kasvusta. Unelmakorpuksen aineistossa 
MLTU:n mediaani on peruskoulun kuudesluokkalaisilla 6 ja yhdeksäs- 
luokkalaisilla 6,2. Nuorilla aikuisilla mediaani on 7,4. Sukupuolen mu- 
kaiset erot ovat kaikissa ryhmissä aika pienet. T-yksikön keskipituus on 
hyvin yleisesti kehitykselliseksi arvioitu mittari (ks. esimerkiksi Nippold 
2006; Nippold ja muut 2005; 2007; Wolf Nelson & Van Meter 2007; 
Hall-Mills & Apel 2015; Mäkinen, Loukusa, Nieminen, Leinonen & Kun- 
nari 2014; Jagaiah, Olinghouse & Kearns 2020), jonka sanamääriä nos- 
taa sekä lauserakenteen rikastuminen että sen tiivistyminen. Eri kieliä 
koskevat tulokset eivät ole suoraan vertailukelpoisia, koska esimerkiksi 
kieliopillinen merkitys ilmaistaan yhdessä kielessä affiksilla, toisessa sa- 
nalla. Vastaavasti lauserakenteen tiiviyttä mittaava kompleksisuusindek- 
si nousee kehityksellisesti. Sen mediaani on kuudennella 1,55, yhdek- 
sännellä 1,58 ja nuorilla aikuisilla 1,67. Molemmissa indekseissä arvojen 
koehenkilökohtainen vaihtelu osoittaa (ks. kaaviot 22 ja 23), että tuloksia 
ei pidä tulkita liian yksioikoisesti. Lisäksi vaihtelua on myös nuorten 
aikuisten tavoitetasoa edustavilla kirjoittajilla. Ääriarvoja on erityisesti 
kuudennen pojilla ja toisaalta naisten ryhmissä. Tilastolliselta kannalta 
muutokset molemmissa mittareissa ovat merkitseviä. 

Erittelemme tässä luvussa, mitkä eri tekijät kompleksisuusmittareita 
nostavat ja miten ne vaikuttavat. Aineistossa on vastakkaisia kirjoittamis- 
strategioita, jotka vaikeuttavat tilastollista analyysiä. Tarkastelemme seu- 
raavaksi, miten paljon sanaluokkakohtaisten frekvenssitietojen avulla 
voi arvioida sitä, mikä nostaa T-yksiköiden sanamääriä tai kompleksisuu- 
sindeksin arvoja. Sanaluokista tarkasteltavina ovat adjektiivit (kuvauk- 
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Sukupuoli 


11.33 Er 
Om 


MLTU 


Kuudes-2006 Kuudes-2014 Yhdeksäs AMK Pääsy 


Kaavio 22. T-yksiköiden keskipituus sanoina (MLTU) ja hajonta Unelmakorpuk- 
sessa. 


sen rikastaminen), substantiivit ja pronominit (viittaussuhteet) sekä 
verbit, koska oletettavasti juuri näiden sanaluokkien määrät vaikuttavat 
joko T-yksiköiden keskipituuteen tai kompleksisuusindeksiin ja molem- 
piinkin. Adjektiiveilla ilmaistaan pääasiassa peruslauseen ytimen ulko- 
puolisia aineksia; substantiivien, pronominien ja verbien keskinäiset 
suhteet liittyvät merkityksen spesifioimiseen ja ilmaisun tiivistymiseen. 
Lisäksi tutkimme alisteisten rakenteiden yleisyyttä paitsi niiden mää- 
ristä myös funktioittain eriteltyinä. Arvioimme tuloksia sekä ikäryhmit- 
täin, sukupuolen mukaan että kirjoittajakohtaisesti ja suhteutamme 
niitä mahdollisuuksien mukaan myös T-yksiköiden keskipituuksiin 
ja kompleksisuusindeksiin sekä tarvittaessa muihinkin indekseihin. 
Vertaamme peruskoululaisia nuoriin aikuisiin. Sanaluokkatietoja on 
kaikista Unelmakirjoitelmista, mutta T-yksiköt ovat muuttujana vain 
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Kaavio 23. Kompleksisuusindeksin mediaani ja hajonta Unelmakorpuksessa. 


Unelmakorpuksessa, jossa kuudesluokkalaisten ja nuorten aikuisten 
kirjoitelmia kumpiakin on yli kolme sataa, muissa peruskouluryhmissä 
on noin 150 kirjoitelmaa. 


Nominaalisten sanaluokkien vaikutus sanamäärään 
ja rakenteen kompleksisuuteen 


Yksittäiset sanaluokat voivat vaikuttaa toisaalta T-yksikön keskipituuteen, 
toisaalta kompleksisuusindeksiin (vrt. Graesser, McNamara, Louwerse & 
Cai 2004). Tarkastelemme ensin nominaalisia sanaluokkia ja pyrimme 
arvioimaan niiden vaikutusta mainittuihin indekseihin ja osaksi teks- 
tin rakenteeseen. Tarkastelemme ohessa myös sanaluokkien laadullisia 
ominaisuuksia (vrt. Price & Jackson 2015, 283). Alkuoletus on, että 
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nominaaliset sanaluokat — kuten adjektiivit ja pronominit — nostavat kes- 
kipituuksia mutta eivät kompleksisuusindeksiä. Tyypillisesti juuri ei-ar- 
gumenttiasemissa käytettävien sanaluokkien edustajat kuten adjektiivit 
ja adverbit näyttävät lisääntyvän kehityksellisesti, vaikka luonnollisesti 
niiden leksikaalinen diversiteetti ja funktioiden erilaistuminen osoittavat 
kehityksen yksityiskohtaisemmin (ks. tarkemmin Kuisma 2011; Pajunen 
2012). Substantiivien määristä ja substantiivien ja pronominien keski- 
näisestä suhteesta voi arvioida tekstin yleisempää luonnetta esimerkiksi 
asteikolla konkreettinen-abstrakti. Substantiivien vaikutus kompleksi- 
suuteen voi kuitenkin olla kahtalainen muun muassa, koska ne toimivat 
paitsi finiittiverbien myös ei-finiittisten verbien argumentteina. Parti- 
siippeja ja infinitiivejä käsittelemme lähinnä verbiluokan alakategorioi- 
na. Adverbien funktio teksteissä on moninainen ja erityisesti temporaa- 
liset ja lokaaliset adverbit lisääntyvät kehityksellisesti. Niiden funktiona 
on kehystää kerrontaa ajallisesti ja paikallisesti. Ne siis voisivat nostaa 
sanamäärää, mutta sivuutamme ne tässä yhteydessä. 


ADJEKTIIVITIHEYS 

Adjektiivit spesifioivat tarkoitteita rajaamalla niiden alaa ja samalla lisää- 
vät tekstin kuvailevuutta. Adjektiivien semanttiset alaluokat eivät näiden 
perusfunktioiden osalta sanottavasti poikkea toisistaan mutta kehityk- 
sellisesti niissä on eroa. Muutosta tapahtuu erityisesti relationaalisista 
adjektiiveista absoluuttisiin, esimerkiksi arvottavista (kiva, hyvä) eksak- 
teihin (kolmiosainen, puinen) (ks. Kuisma 2011). Unelmakirjoitelmista 
oletus on, että joillakin kirjoittajilla juuri adjektiivit nostavat T-yksik- 
köjen keskipituutta. Tähän viittaa muun muassa se, että käyttö voi olla 
lähes kliseistä. Esimerkiksi nuoret aikuiset luonnehtivat ilmaa, paikka- 
kuntaa, päivää, salaattia, taloa ja vettä raikkaaksi (vrt. raikas juoma, luon- 
nonkaunis ja raikas Kaustinen). Erityisesti attribuuttiasemaiset nostavat 
keskipituuksia; predikoivat adjektiivit ovat kopulalauseen pakollisia jäse- 
niä eivätkä tuo ylimääräistä lauseeseen. Silti myös kopulalauseet lisään- 
tyvät kertovassa tekstissä kehityksellisesti (ks. Sintonen 2011). Alakoulu- 
ikäisillä yleisimmät viisi adjektiivia (kiva, oma, hyvä, uusi ja iso) kattavat 
24,3 prosenttia adjektiiviesiintymistä ja yhden esiintymän adjektiivit eli 
HL-adjektiivit (kuten kapea, karmiva, karvainen, kastanjanruskea) 10 pro- 
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senttia. Nuorilla aikuisilla yleisimmät viisi adjektiivia (hyvä, pieni, oma, 
uusi ja suuri) kattavat 16 prosenttia adjektiiviesiintymistä ja HL-adjektii- 
vit (kahvintuoksuinen, kaikenikäinen, kaksitoistasylinterinen, kalpea) 16,5 
prosenttia. Sanomalehtitekstissä (SS2002, Pajunen & Virtanen 2002) 
samat suhteet ovat 14 prosenttia ja 5,2 prosenttia ja yleisimmät adjek- 
tiivit ovat pieni-sanaa lukuun ottamatta samoja kuin aikuisilla. Adjektii- 
vien diversiteetti nousee kehityksellisesti, mutta korpus sinänsä on 
liian pieni, jotta luvut vielä vakiintuisivat. Adjektiivimääriä arvioitaessa 
mukana ovat kaikki leksikaaliset adjektiivit mutta myös pronominaali- 
adjektiivit (esimerkiksi sellainen), joiden määrä kuitenkin on hyvin pieni. 

Adjektiiviesiintymien määrä eli adjektiivitiheys on laskettu kirjoitelmi- 
en kokonaissanamäärästä koehenkilöittäin ja ikäryhmittäin sekä suku- 
puolittain (ks. taulukko 60). Alakoulun tytöillä on adjektiiveja selvästi 
enemmän ja monipuolisemmin käytössä kuin pojilla; yläkoulussa ero 
on vielä suurempi. Alakoulun ensimmäisellä ja toisella luokalla on vielä 
paljon kirjoitelmia, joissa ei ole lainkaan adjektiiveja. Näiden osuus las- 
kee nopeasti ja alakoulussa adjektiivien määrä nousee eniten ryhmässä 
1-5 prosenttia sanamäärästä. Tosin pojilla on pitkään kokonaan adjektii- 
vittomia kirjoitelmia. Kuudesluokkalaisilla tytöillä tyypillinen määrä on 
6-10 prosenttia kokonaissanamäärästä ja pojilla 1-5 prosenttia. Suhde 
on yhdeksäsluokkalaisilla samantapainen mutta hieman korkeampi. Pe- 
ruskoululaisista reippaasti alle puolella adjektiiviesiintymiä on 6-10 pro- 
senttia sanoista, nuorista aikuisista kaksi kolmasosaa yltää tähän mää- 
rään. Viidenneksellä naispuolisista aikuisista adjektiiveja on jopa 15-20 
prosenttia sanaesiintymistä. Pääsykoeaineistossa adjektiiveja on käytetty 
jonkin verran enemmän kuin ammattikorkeakouluaineistossa. Savon 
Sanomissa adjektiivitiheys esiintymistä on 8 prosenttia, joten korkeim- 
mat Unelma-adjektiiviprosentit ovat leimallisen korkeita. Vastaavasti 
korkeat adjektiivien käyttämättömyysprosentit paria ensi kouluvuotta 
lukuun ottamatta ovat kehityksellisesti merkitseviä. 

Arvioimme sanaluokkakohtaista esiintymistiheyttä myös laskemalla 
kunkin sanaluokan tiheyden korrelaatiota pääosin T-yksikön keskipituu- 
teen ja kompleksisuusindeksin arvoihin. Tulokset esitetään ikäluokittain 
ja sukupuolittain eriteltynä kaaviomuodossa (ks. kaaviot 24 ja 25 adjek- 
tiiveista). Tarkastelu keskittyy kuudensiin, yhdeksänsiin ja nuoriin ai- 
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Taulukko 6o. Adjektiivitiheys Unelmakirjoitelmissa. 


Tkäluokka / o 1-5 6-10 11-15 16—20 21—25 % 
Kirjoitelma % 

1.—2. F 26,3 40,9 18,9 8,7 2,9 2,2 
1-2. M 38,6 35,7 14,3 5.7 3,6 2,1 
3.-4. F 6,1 50,3 31,3 10,4 1,8 o 
3.—4. M 16,7 44,0 28,6 7,7 3,0 o 
Viides F 2,7 65,3 24,0 6,6 1,3 o 
Viides M 13,9 55,7 24,0 5,1 1,2 o 
Kuudes F 2,5 44,1 45,9 57 L9 o 
Kuudes M 4,6 56,3 33,1 5,3 o 0,7 
Yhdeksäs F 2,3 30,2 60,5 7,0 o o 
Yhdeksäs M 2,8 50,0 44,4 2,8 o o 
Aikuiset F o 10,0 67,1 22,5 0,4 o 
Aikuiset M o 12,4 74,6 11,3 1,7 o 


kuisiin, joilla adjektiivitiheys on jo vakiintuneempi kuin nuorimmilla 
alakoululaisilla. Nämä kahden kielellisen ja kahden demografisen muut- 
tujan kaaviot näyttävät ikä- ja sukupuolierot aika suoraan mutta ikäluok- 
kakohtaiset vaikutukset tulevat tarkemmin esiin vasta, kun suhteutetaan 
tiheysmuuttujien korrelaation kautta syntyvät arvot tiheysmuuttujien 
mediaaneihin. Toisin sanoen vertailu ei nyt perustu yksin kuvaan vaan 
y-akselin ja sanaluokkamediaanin arvoihin eli siihen, onko kahden 
kielellisen muuttujan korrelaatiosta laskettu tiheysarvo yli vai ali sen 
mediaanin. Adjektiivimediaanit ovat kuudennella 6,1 (tytöt) ja 4,9 (po- 
jat); yhdeksännellä 7,5 ja 5,6 sekä aikuisilla 9,3 ja 8,8. 

Adjektiivit nostavat kuudensilla T-yksikön sanamääriä, pojilla hieman 
enemmän kuin tytöillä (ks. kaavio 24). Tästä voisi päätellä, että adjektiivi- 
tiheyden nousu erityisesti pojilla on kehityksellinen, koska juuri alakou- 
lussa on paljon adjektiiveja käyttämättömiä poikia. Muissa ikäryhmissä 
vaikutus on käänteinen yhdeksännen poikia lukuun ottamatta. Tämä 
johtunee siitä, että kehittyneimmillä kirjoittajilla on adjektiivien käy- 
tössä niin suurta vaihtelua, että vaikutus ei tule ryhmätasolla näkyviin. 
Nuorimmilla kirjoittajilla adjektiivien korkea määrä liittyy myös lause- 
rakenteen kompleksisuuteen (ks. kaavio 25). Tämän voi katsoa viittaavan 
siihen, että kuudesluokkalaisten keskivertotekstiä rikastetaan adjektii- 
veilla ja kompleksisilla lauserakenteilla, lähinnä 1. infinitiivillä ja sivu- 
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Kaavio 24. Adjektiivitiheys ja T-yksikköjen sanamäärä. Mediaani: kuudes tytöt 6,1 
ja pojat 4,9, yhdeksäs 7,5 ja 5,6 ja aikuiset 9,3 ja 8,8. 


lauseilla. Nuorilla aikuisilla adjektiivitiheys ei enää nosta kompleksisuut- 
ta. Yhdeksännen tytöt muistuttavat adjektiivitiheydessä nuoria aikuisia. 
Kaikkiaan adjektiivien käytöllä on indekseihin eniten vaikutusta nuo- 
rimmilla kirjoittajilla. 

Adjektiivien ja substantiivien suhteellinen osuus nousee ikäluokittain 
tasaisesti ja samalla substantiivia rajaavien adjektiivien — modifioinnin 
— määrä nousee. Multikollineaarisuus estää näiden muuttujien korre- 
laation laskemisen. Finiittiverbien määrä on nuoremmilla kirjoittajilla 
korkeampi kuin vanhemmilla, mutta peruskoulun kuudennella ja eten- 
kin pojilla adjektiivitiheys ja finiittiverbien määrä kulkevat käsi kädessä. 
Aikuisilla ja yhdeksännen tytöillä korrelaatio on negatiivinen: adjektii- 
veja on keskimääräistä vähemmän, jos finiittiverbien määrä on korkea. 
Sukupuolittain ero on suurin yhdeksäsluokkalaisilla. 
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Kaavio 25. Adjektiivitiheys ja kompleksisuusindeksi. Mediaani: kuudes tytöt 6,1 
ja pojat 4,9, yhdeksäs 7,5 ja 5,6 ja aikuiset 9,3 ja 8,8. 


Esimerkki 3 edustaa aikuisnäytettä, jossa on paljon adjektiiveja, esi- 
merkki 4 on päinvastainen. Vaikutelma on molemmissa tyylillinen. 
Esimerkissä 3 sävy on rento. Vain yksi adjektiiveista predikoi. Esimerkis- 
sä 4 lauseet ovat lyhyitä ja sävy toteava. Esimerkissä 5 adjektiivien määrä 
on melko korkea mutta monet ovat predikoivassa funktiossa ja eivät 
kasvata keskipituutta samalla tavalla kuin näytteessä 3. Tosin myös pre- 
dikoivat lauseet luovat tekstiin kuvailevuutta. 


Adjektiiveja 16,7 % sanoista, MLTU = 14, kompleksisuusindeksi = 2,1: 
3) Turhanpäiväisen katurallin jälkeen olisi aika siirtyä lounaalle. Lou- 
naaksi valikoituisi grillattua härkää ja ehkä tilkkanen hieman nah- 
kaista ja kielellä viipyilevää punaviinia. Täyttävän ja maittavan lou- 
naan jälkeen olisi aika siirtyä isommalla porukalla saunomaan,- —. 
(AMKM33) 
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Adjektiiveja 4,7 % sanoista, MLTU = 4,9, kompleksisuusindeksi 
= 155 

4) Minä herään myöhään aamupäivällä. Myöhäisellä aamupäivällä 
tarkoitan ennen puoltapäivää, mutta jälkeen kymmenen. Linnut eivät 
laula. Syön aamiaisen. En mitään outoa tai kummallista; muroja tai 
puuroa sekä lasillisen maitoa. Lähden käymään kaupassa. (AMKM58) 


Adjektiiveja 10,8 % sanoista, MLTU = 6, kompleksisuusindeksi 
= 1,4: 

5) Unelmieni päivääni voisi kuvitella arkiseksi, minulle se kuitenkin on 
täynnä niitä asioita mistä nautin ja mistä saan voimaa työssä käyntiin 
ja opiskeluuni. Tällainen yhteinen vapaapäivä on harvinainen meidän 
taloudessa, joten koen sen sitäkin arvokkaammaksi. (AMKF92) 


Adjektiivien määrä nousee kehityksellisesti. Sukupuolten välinen ero py- 
syy samansuuntaisena alakoulusta lähtien siten, että naiskirjoittajilla on 
aina enemmän adjektiiveja kuin mieskirjoittajilla. Vaikutus MLTU:hun 
on ryhmätasolla vähäinen nuorimpia lukuun ottamatta mutta yksilö- 
tasolla vaihteleva. Nuorilla adjektiivit liittyvät kompleksiseen lauseraken- 
teeseen mutta vanhemmilla eivät. 


SUBSTANTIIVITIHEYS 

Substantiiveista valtaosa on kaikilla kirjoittajilla appellatiiveja. Alakoulu- 
laisilla kymmenen yleisintä substantiivilekseemiä kattaa kaikista 17 pro- 
senttia ja 30 yleisintä jo kolmanneksen. Aikuisilla kymmenen yleisintä 
kattaa substantiiviesiintymistä saman verran mutta 30 yleisintä vain nel- 
jänneksen. Diversiteetti siis kasvaa selvästi iän myötä (ks. myös Laine- 
Leinonen 2013); aikuisilla suurin osa substantiiveista on HL-lekseeme- 
jä, lapsilla joka kymmenes substantiivi. Alakoululaisilla substantiiveista 
kymmenisen prosenttia on propreja mutta nuorilla aikuisilla vain neli- 
sen prosenttia. Kirjoitelman aihe vaikuttaa suuresti yleisyyteen, siten 
kaikilla substantiivit päivä ja unelma ovat yleisimpien joukossa. Alakou- 
luikäisillä yleisiä substantiiveja ovat lisäksi äiti, kaveri, koti, koira ja hevo- 
nen, aikuisilla aika, elämä, hetki ja ystävä. Aikuisilla siis abstraktit käsit- 
teet nousevat konkreettisten rinnalle. Ravidin (2006) heprean kielestä 
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tehdystä tutkimuksesta kävi ilmi, että abstraktien substantiivien osuus 
kasvaa vähitellen ja muutos on selvintä nuoruusiässä; narratiiveissa abst- 
raktistuminen on hitaampaa kuin erittelevissä teksteissä. Substantiiveis- 
ta minen-johdokset ovat selvästi abstrakteja ja myös sikäli nuorille kirjoit- 
tajille hankalia, että niiden käyttö edellyttää kykyä tiivistää ja fokusoida 
peruslauseen sisältämää informaatiota. Minen-substantiiveja on kaiken- 
ikäisten kirjoitelmissa, mutta ne ovat kaikissa kirjoittajaryhmissä pää- 
asiallisesti HL-lekseemejä. Alakoulun luokilla 1.5. minen-johdoksia on 
0,07 prosenttia kokonaissanamäärästä, kuudennella 0,2, yläkoulun luo- 
killa 0,3 ja nuorilla aikuisilla 0,6, toisin sanoen myös abstraktien minen- 
substantiivien määrä nousee kehityksellisesti. Bermanin, Nayditzin ja 
Ravidin (2011, 174) mukaan abstraktien substantiivien osuus lisääntyy 
lasten ja nuorten kertomuksissa, jos kirjoittajan sosio-ekonominen taus- 
ta on korkea. Suomen aineisto ei ole sosioekonomisesti tasakoosteinen. 
Substantiiveiksi on Unelma-aineistossa koodattu appellatiivit ja 
proprit, jotka eivät ole muodoltaan kiteytyneitä, toisin sanoen taipuvat 
periaatteessa sijataivutuksen eri muodoissa ja toimivat lauseessa kaikis- 
sa argumenttiasemissa. Jo NIVR-indeksi (eli substantiivien ja verbien 
suhde) ja leksikaalinen tiheys osoittivat edellisessä luvussa substantii- 
vien määrän kehityksellisen nousun. Substantiiveja voidaan tarkastella 
myös suhteessa kokonaissanamäärään eli substantiivitiheytenä (nominal 
density). Ravidin (2006, 792) mukaan substantiivitiheys kasvaa erityises- 
ti nuoruusvuosina ja korreloi leksikaalisen diversiteetin kanssa; teksti on 
myös syntaktisesti sitä kompleksisempaa mitä enemmän siinä on subs- 
tantiiveja ja adjektiiveja. Suomen aineistossa adjektiivimäärä ei vaikuta 
aikuisilla lausetason kompleksisuuteen vaan lisää sanoja lauseketasolla 
ja T-yksikössä. Substantiiviosuudet on laskettu vajaasta 2 000 kirjoitel- 
masta, mutta Ravidin tutkimuksessa on kaikkiaan vain 80 kirjoitelmaa, 
joten voi olla, että erot tasaantuvat suuremmassa aineistossa. 
Substantiivitiheys vaihtelee kirjoitelmien kokonaissanamääristä 12 pro- 
sentista 46 prosenttiin, mutta mediaaneista vaihtelu ei sanottavasti näy: 
alakoulussa mediaani on 30 prosenttia ja nuorilla aikuisilla 31,5 prosent- 
tia. Muutos näkyy kuitenkin yksilövariaation kautta. Kuudesluokkalaisilla 
substantiiveja on kirjoitelmissa lähes yhtä usein 20-30 prosenttia koko- 
naissanamäärästä kuin 30-40 prosenttia, ja iän myötä jälkimmäinen 


SYNTAKTISTA RAKENNETTA TIIVISTÄVÄT JA KOMPLEKSISTAVAT TEKIJÄT ... 437 


https://doi.org/10.21435/skst.1472 


ryhmä kasvaa nopeasti (ks. taulukko 61). Nuorimmilla alakoulun kir- 
joittajilla sekä hyvin pienet että hyvin suuret substantiivimäärät liittyvät 
ongelmateksteihin. Näitä poikkeavia arvoja on alimmilla luokilla 20-40 
prosentissa kirjoitelmista. Aikuisilla miehillä substantiivien osuus on 
selvästi suurempi kuin naisilla. Ero näkyy jo yhdeksäsluokkalaisilla ai- 
van Ravidin tulosten mukaisesti. Savon Sanomissa substantiivitiheys 
on 45 prosenttia kokonaissanamäärästä. — Todettakoon ohimennen, 
että korkea substantiivimäärä korreloi positiivisesti nuorten aikuisten 
aineistossa pääsykoepisteisiin, vastaavasti korkea pronomini- ja finiitti- 
verbien osuus korreloi negatiivisesti.'*t Toisin sanoen korkeilla pisteillä 
pääsykokeen läpäissyt on kirjoittanut Unelmakirjoitelman, jossa subs- 
tantiivimäärä on korkea mutta ei-kompleksiseen tekstiin viittaavien fi- 
niittiverbien määrä matala. 


Taulukko 61. Substantiivitiheys Unelmakirjoitelmissa. 


Tkäluokka / 1-10 11-20 21—30 31-40 Yli 40 % 
Kirjoitelma % 

1.—2. F 1,4 8,7 37,2 34,3 18,2 
1-2. M 1,4 8,6 32,8 27,1 30 
3.-4. F o 6,7 49,1 36,2 8,0 
3—4. M o 10,7 3959 3557 13,7 
Viides F o 4 41,3 49,3 533 
Viides M o 3,8 46,8 38,0 11,4 
Kuudes F o 1,8 46,9 45,0 6,2 
Kuudes M o 5,9 41,2 43,1 9,8 
Yhdeksäs F o 2,2 45,4 45,4 6,8 
Yhdeksäs M o 4,2 33,3 54,2 8,3 
Aikuiset F o 2,3 37,2 60,4 o 
Aikuiset M o 1,7 26,3 68,4 3,5 


Substantiivien ja T-yksikön sanamäärän suhdetta ei pysty suoraan laske- 
maan, joten tarkastelemme substantiivitiheyttä substantiivi-verbisuh- 
teen (= NTVR) kautta. Laskentatapa on sama kuin edellä adjektiivien 
yhteydessä. NTVR-suhde kuvaa tekstin substantiivipitoisuutta suhteessa 
verbien määrään, ja se on kertovassa tekstissä oletuksen mukaan hie- 


124 Osa nuorista aikuisista kirjoitti Unelmakirjoitelman ylipiston pääsykokeen yhteydessä. Heistä on mo- 
nenlaisia vertailutietoja. 
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man yli yhden suhdetta yhteen. NTVR ja T-yksikön sanamäärien suhde 
on negatiivinen mieskirjoittajilla — eli korkea substantiivimäärä laskee 
T-yksikön sanamääriä —, mutta naiskirjoittajilla vaikutus on positiivinen 
vaikka vähäinen (ks. kaavio 26). NTVR-mediaani on kuudennella tytöillä 
51,2 ja pojilla 52,6, yhdeksännellä 51,5 ja 53 sekä aikuisilla 53,4 ja 54,5. 


Sukupuoli 
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Kaavio 26. NTVR-suhde ja T-yksikköjen sanamäärä. NTVR-mediaani: kuudes 51,2 
ja 52,6, yhdeksäs 51,5 ja 53 sekä aikuiset 53,4 ja 54,5. 


Peruskoululaisilla NTVR on nouseva kompleksisessa tekstissä yhdek- 
sännen poikia lukuun ottamatta (ks. kaavio 27). Aikuisilla NTVR-suhde 
laskee kompleksisessa tekstissä. Ero voi johtua komplementtilauseiden 
edustumisesta joko sivulauseena tai lauseenvastikkeena. - NTVR-me- 
diaani on kuudensilla 51,2 ja 52,6, yhdeksänsillä 51,5 ja 53 sekä aikuisilla 
53:4 ja 54,5- 
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Kaavio 27. NTVR ja kompleksisuusindeksi. NTVR-mediaani: kuudes 51,2 ja 52,6, 
yhdeksäs 51,5 ja 53 sekä aikuiset 53,4 ja 54,5. 


Esimerkit 6-9 kuvaavat taulukon 61 jaottelun mukaan vaihtelevaa sub- 
stantiivimäärää vähästä keskimääräiseen ja paljoon. Kaikki esimerkit 
ovat kuudesluokkalaisilta. Jos substantiivien määrä on hyvin pieni (ks. 
esimerkki 6), teksti on selvästi heikkoa. Näytteissä 7—9 pelkkä substan- 
tiivien määrä ei riitä jakamaan niitä tason mukaan, mutta kun substan- 
tiivien suhteellinen osuus nousee, teksti joko irtautuu minä-kerronnasta 
(8) tai tarkoitteita tuodaan tekstiin enemmän ja samalla kerronta tulee 
täsmällisemmäksi (9). 


Vähän substantiiveja (10-20 % sanamäärästä): MLTU = 3,4, komp- 


leksisuusindeksi = 1, leksikaalinen tiheys = 59,3, substantiivi-verbi- 
indeksi = 33,3: 
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6) Mä lennän ja törmään puuhun ja sit oon koomassa ja sit mä he- 
rään ja voitan lotossa ja ostan jotakin turhaa. (6M4) 


Substantiiveja (20-30 % sanamäärästä): MLTU = 6,6, kompleksi- 
suusindeksi = 1,6, leksikaalinen tiheys = 73,8, substantiivi-verbi- 
indeksi = 49,5: 

7) Minun mielestäni unelmieni päivä olisi tälläinen: vesihiihtäisin, sai- 
sin ratsastaa hepalla ja olla serkullani yötä. Serkkuni nimi on Anna. 
Hänellä on kauniit ruskeat hiukset ja siniset silmät. Hänen perheen- 
sä asuu omakotitalossa, jossa on valtava takapiha. Leikimme erittäin 
usein ja erityisesti lomilla. (6F14) 


Keskimääräisesti substantiiveja (30-40 % sananmäärästä): MLTU 
= 6,1, kompleksisuusindeksi = 1,6, leksikaalinen tiheys = 67,5, 
substantiivi-verbi-indeksi = 53,9: 

8) Unelmien päivä olisi päivä Helsingissä — — Astun junasta pois Hel- 
singin yhdellä rautatieasemalla. Näen paljon ihmisiä, mutta yksi on 
yli muiden. Hän seisoo kolmen muun miehen kanssa asemalla. Jotkut 
ihmiset pyytävät niiltä nimmareita. (6F40) 


Hyvin paljon substantiiveja (yli 40 %): MLTU = 4,7, kompleksisuu- 
sindeksi = 1,2, leksikaalinen tiheys = 87,8, substantiivi-verbi-indek- 
si = 62,1: 

9) Unelmieni päivän voisin viettää Hawajilla kolme viikkoa. Makaisin 
auringon alla päivät pitkät! Ihailisin eksoottisia maisemia. Se olisi mi- 
nulle kuin unelmien täyttymys, paratiisi. Seuraavana päivänä voisin 
shoppailla päivän ilmaiseksi. (6F5) 


PRONOMINITIHEYS 
Unelmakirjoitelmien pronominijakauma persoona-, demonstratiivi- ja 


indefiniittipronomineihin sekä lausetta aloittaviin relatiivisiin ja interro- 
gatiivisiin pronomineihin muuttuu iän mukaan; laskelmissa ei ole mu- 


kana pronominaaleja. Persoona- ja demonstratiivipronominit ovat hal- 
litsevia ensimmäisen ja toisen luokan kirjoitelmissa, minä-pronomini 


menettää asemiaan kolmannella ja neljännellä, viidennellä ja kuuden- 
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nella hän- ja se-pronomini ovat yleisimmät. Myöhemmin nousee erityi- 
sesti indefiniittipronominien luokka yleisimmäksi. Näiden pronominien 
vaikutusalana on pääsanan alan tietynlainen kvalifiointi, joten ne muis- 
tuttavat tässä suhteessa adjektiiveja. Relatiivi- ja interrogatiivipronomi- 
nien osuus kasvaa ensimmäisen luokan noin 8 prosentista tasaisesti 
aikuisten runsaaseen 15 prosentin osuuteen koko pronominiluokasta. 
Lehtiteksteissä lausetta aloittavien pronominien osuus on vielä run- 
saampi eli 19 prosenttia pronominiluokasta. Sekä indefiniittisten yksi- 
löivien ja kvantifioivien pronominien että sivulauseita aloittavien pro- 
nominien määrän kasvu on selvästi kehityksellistä, mutta muutokset 
persoonapronomineissa liittyvät kertovaan tekstiin ja kertojan roolien 
monipuolistumiseen. Persoonapronominit eivät oletettavasti vaikuta 
tekstin kompleksisuuteen. 

Peruskoulun pojilla on kirjoitelmissaan vähän vähemmän pronomi- 
neja kuin tytöillä mutta aikuisryhmässä tilanne on päinvastainen (tau- 
lukko 62). Tavanomaisin määrä asteikolla vähästä paljoon on ensim- 
mäistä ja toista luokkaa lukuun ottamatta 6-10 prosenttia sanamäärästä. 
Pienin osuus kasvaa iän myötä, joskin mieskirjoittajilla hieman eri ta- 
voin kuin naiskirjoittajilla. Naiskirjoittajilla kehityslinja on melko tasai- 
nen. Kirjoitelmia on pienimmässä pronominiryhmässä vähemmän 
kirjoittajien iän noustessa, ja toiseksi suurin määrä vastaavasti nousee. 
Aikuiset mieskirjoittajat — melko hyvät mieskirjoittajat — eivät sanotta- 
vasti poikkea tästä linjasta, joskin naiskirjoittajien tekstejä on enemmän 
luokassa 6-10 prosenttia sanamäärästä ja mieskirjoittajien luokassa 
11-15 prosenttia sanamäärästä. Sen sijaan peruskoulun pojat poikkeavat 
kuvasta: heillä on sekä pieniä että suuria pronominimääriä enemmän 
kuin muilla kirjoittajilla. Mediaani pysyttelee kaikilla muilla paitsi yh- 
deksännen pojilla melko samoissa lukemissa. Pronominitiheys on sa- 
nomalehtikielessä 5,3 prosenttia. Ero Unelmakirjoitelmiin liittyy pääosin 
tekstin luonteeseen, mutta heikoilla kirjoittajilla pronominitiheys voi 
nousta myös löysien viitesuhteiden tai pronominiketjujen vuoksi. 

Pronominit nostavat MLTU:ta kaikissa muissa ryhmissä paitsi kuu- 
dennen luokan tytöillä (ks. kaavio 28). Aikuisilla nousu on hyvin selvä 
mutta miehillä suurempi kuin naisilla. Taustalla on todennäköisimmin 
indefiniittisten, relatiivisten ja interrogatiivisten pronominien vaikutus. 
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Taulukko 62. Pronominitiheys Unelmakirjoitelmissa. 


Ikäluokka o-5 6-10 1115 16—20 Yli 20 % 
Kirjoitelma % 
1.—2. F 25,5 26,3 21,9 13,8 12,4 
1.—2. M 38,6 22,1 18,6 7,1 13,6 
3.—4. F 16,5 32,5 35,0 79 79 
3.-4.M 18,4 28,0 28,6 18,4 6,5 
Viides F 9.3 37,3 44,0 6,6 2,6 
Viides M 12,6 49,5 22,8 15,2 o 
Kuudes F 11,2 48,7 33,7 5,6 0,6 
Kuudes M 14,5 48,0 24,3 11,8 1,3 
Yhdeksäs F 79 55:7 29,5 3:4 3,4 
Yhdeksäs M 22,2 47,2 19,4 9,7 1,4 
Aikuiset F 6,1 57,2 30,9 5,6 o 
Aikuiset M ha 52,6 36,1 41 o 
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Kaavio 28. Pronominitiheys ja T-yksikköjen sanamäärä. Pronominimediaanit: 


kuudes 8,8 ja 8,8, yhdeksäs 8,7 ja 7,8 sekä aikuiset 8,9 ja 8,8. 
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Kaavio 29. Pronominitiheys ja kompleksisuusindeksi. Pronominimediaanit: kuu- 


des 8,8 ja 8,8, yhdeksäs 8,7 ja 7,8 sekä aikuiset 8,9 ja 8,8. 


Jos tekstissä on paljon pronomineja, myös sen kompleksisuus on nou- 
susuuntainen (ks. kaavio 29), mutta tytöillä vähemmän kuin pojilla. 
— Pronominimediaanit ovat kuudensilla 8,8 ja 8,8, yhdeksänsillä 8,7 ja 
7,8 sekä aikuisilla 8,9 ja 8,8. 

Esimerkkitekstit 10-11 ovat yhdeksänneltä luokalta ja osoittavat, mi- 
ten erilaiset tekijät vaikuttavat muuttujan arvoihin. Kirjoitelmassa 10 
pronominimäärää laskee verbiin koodattu minä-kerronta, kirjoitelmassa 
11 sitä nostaa muun muassa kvanttorien runsaus. Tekstin laatimistapa 
vaikuttaa siis ratkaisevasti. 


Vähän pronomineja (2,2 % sanamäärästä), leksikaalinen tiheys = 
76,4, NIVR-indeksi = 56,4, MLTU = 5,9, kompleksisuusindeksi 


=1,5: 
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10) Unelmapäivä alkaisi sillä että heräisin pirteänä ja hyvin nukku- 
neena. Aurinko paistaisi ikkunasta ja palvelia toisi aamupalan sän- 
kyyn ja ilmoittaisi että olen voittanut lotossa jättipotin. Syömisen jäl- 
keen laittaisin mukavat vaatteet päälleni ja menisin aamu-uinnille ulos 
uima altaaseen. (9F15) 


Suhteessa paljon pronomineja (16,4 % sanamäärästä), leksikaali- 
nen tiheys = 65,7, NTVR-indeksi = 54,1, MLTU = 9,6, kompleksi- 
suusindeksi = 1,8: 

11) Unelmieni päivä olisi sellainen että ei olisi koulussa sääntöjä koko 
päivänä ja että kaupassa saisi hakea kaikkea ilmaseks. Sitten Saksa 
pyyhittäs maailmankartalta ja että kaikki Aasialaiset teloitettaisiin ei 
sillä että mulla ois jotain aasialaisia vastaan mutta se on ärsyttävä 
maan-osa. (9M83) 


Verbaalisten sanaluokkien vaikutus rakenteen sanamääriin 
ja kompleksisuuteen 


Verbeissä samojen lekseemien toisteisuus on luonnollisesti paljon suu- 
rempi kuin substantiiveissa. Kaikkein yleisimpiä verbejä käytetään en- 
nemmin syntaktisessa tai kieliopillisessa funktiossa kuin leksikaalisessa, 
mikä nostaa sekä sanamääriä että kompleksisuutta. Yleisimmät ovat 
sekä lapsilla että aikuisilla pitkälti samoja verbejä: olla, saada, haluta, 
tulla. Alakoulun luokilla 1-5. yleisimmät seitsemän verbilekseemiä kat- 
tavat verbiesiintymistä lähes puolet, nuorilla aikuisilla sama verbimäärä 
kattaa vain runsaan kolmanneksen esiintymistä. Samat lekseemit hallit- 
sevat sanomalehtikielen yleisyystilastoa ja kattavat myös kolmanneksen 
verbiesiintymistä. Alakoulussa HL-verbilekseemien osuus esiintymistä 
on 2,6 prosenttia (esimerkiksi vääntyä, ylittää, yllättyä, ystävystyä, älämö- 
listä), nuorilla aikuisilla 4,3 prosenttia (esimerkiksi ähistä, äksyillä, äkätä, 
ärsyttää, äyskäröidä). Miljoonan sanan lehtikielessä HL-verbilekseemien 
osuus esiintymistä on enää vajaa prosentti. 

Verbien osuus kokonaissanamäärästä on kaikissa ikäryhmissä saman- 
tapainen: mediaani on hieman alle 30 prosenttia. Nuorimmilla verbien 
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tavallisin yleisyysluokka on 20-29 prosenttia sanamäärästä, viidennen 
pojilla ryhmä 30-39 prosenttia on yleisin, mutta kuudesluokkalaisista 
lähtien yleisyysluokka 20-29 prosenttia on vallitseva (ks. taulukko 63). 
Vaihtelu on myös sukupuolesta riippumatta melko vähäistä alakoulun 
jälkeen mutta kaikkiaan kirjoittajien määrä on luokassa 20-29 prosent- 
tia nouseva. Ilmeisesti iän myötä muiden ainesten osuus sanamassasta 
kasvaa verbien kustannuksella ja oletettavasti nostaa paitsi sanamääriä 
myös kompleksisuutta. Sanomalehtikielessä verbiesiintymiä on 21,9 pro- 
senttia kaikista sanaesiintymistä. Verbejä käytetään monissa eri funk- 
tioissa ja on todennäköistä, että verbien syntaktinen ja leksikaalinen 
variaatio ikään kuin häviää sanaluokan sisään. Peruskoulun pojilla on 
kaikilla poikkeavia arvoja ja prosenttiosuus on normaalijakaumaan ver- 
raten hieman liian korkea. 


Taulukko 63. Verbitiheys Unelmakirjoitelmissa. 


Ikaluokka / 0-9 10-19 20-29 30-39 — 40 % tai yli 
Kirjoitelma % 

1-2. F 3,6 6,5 48,5 32,6 8,7 
1-2. M 6,5 43 39,6 32,4 173 
3-4. F o 3,6 58,9 35,6 18 
3.—4. M 0,6 8,9 56,4 32,1 1,8 
Viides F o o 56,0 42,7 1,3 
Viides M o 5,1 39,2 54,4 1,3 
Kuudes F o 1,2 63,1 33,7 1,9 
Kuudes M o 6,1 57,4 35,1 1,4 
Yhdeksäs F o 11 65,9 32,9 o 
Yhdeksäs M 1,4 1,4 65,3 29,2 2,8 
Aikuiset F o 0,4 75,6 23,9 o 
Aikuiset M o LI 74,7 24,2 o 


Kun arvioidaan T-yksikön rakenteen kompleksisuuteen vaikuttavia teki- 
jöitä, kannattaa analyysi pohjata erityisesti T-yksikön verbien asemaan ja 
funktioihin. Yksinkertaisin rakenne koostuu finiittiverbillisestä yksinäis- 
lauseesta mutta kompleksinen rakenne lisäksi sekä finiittiverbillisistä 
alisteisista lauseista että rakenteista, joissa on ei-finiittistä ainesta. Hallit- 
sevan lauseen ja alisteisen aineksen suhde on asymmetrinen. Esimer- 
kiksi Langackerin (2014) mukaan hallitsevan ja alisteisen aineksen suh- 
de voidaan määritellä neljän kriteerin perusteella, jotka ovat täydellisyys 
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(completeness), sisältyvyys (containment), prominenssi (prominence) ja 
saavutettavuus (accessability). Alisteinen rakenne on siis epäitsenäinen, 
sisältyy laajempaan kokonaisuuteen, ei ilmaise pääväitettä eikä johda 
toiseen elementtiin tai pohjusta sen esiintymistä. Langackerin määri- 
telmä katsoo suhdetta useammalta kielen tasolta (ks. myös esimerkiksi 
Herlin, Visapää & Kalliokoski 2014). Tässä yhteydessä T-yksiköiden ana- 
lyysi pohjaa syntaktis-semanttiseen analyysiin, Schneiderin ja muiden 
(2015) ohjeistukseen mutta myös siihen, miten kirjoittaja on tekstinsä 
rakentanut. Unelmakorpuksen kirjoitelmien T-yksiköistä kuudessa kym- 
menestä on alisteista ainesta, joko ei-finiittisiä muotoja tai alisteisia lau- 
seita (ks. taulukko 64). Määrä kasvaa kehityksellisesti. Kuudensilla on 
myös selvä ajallinen ero siten, että vuoden 2006 kuudesluokkalaisilla 
alisteisia aineksia on T-yksiköissä huomattavasti enemmän kuin vuoden 
2014 kuudesluokkalaisilla. Fro on tytöillä lähes kymmenen prosentti- 
yksikköä, pojilla runsaat viisi. 


Taulukko 64. Alisteisen ja ei-finiittisen aineksen osuus T-yksikköjen kokonaismäärästä. 


Ikäluokka / Alisteinen aines T-yksiköissä F% M % 
2006-Kuudes 60,0 61,3 
2014-Kuudes 515 55,7 
Yhdeksäs 61,3 62,2 
Aikuiset 67,3 72,7 


Alisteisen aineksen perusteella laskettu kompleksisuusindeksi ei erotte- 
le ei-finiittisiä ja finiittisiä alistusrakenteita toisistaan, vaikka näissä voi 
olla kirjoittamisstrategian, ikäluokan tai yksilön kannalta suuria eroja. 
Voi myös olettaa, että esimerkiksi runsas propositionaalisten asenteiden 
ilmaisu (eli modaaliverbien käyttö) ja toisaalta sivulauseiden käyttö vai- 
kuttavat kompleksisuuteen eri tavoin. Vastaavasti voi olla, että näissä on 
kehityksellistä eroa. Tarkastelemme T-yksiköiden sisäistä jakautumista 
tarkemmin jakamalla verbisanaluokan finiittiverbeihin, verbin rektio- 
infinitiiveihin (eli a- ja ma-infinitiivit) ja muihin ei-finiittisiin aineksiin. 
Paitsi finiittista ja ei-finiittistä käyttöä, tarkastelemme myös alisteisten 
sivulauseiden käyttöä kirjoitelmissa. Muuttujat ovat entiseen tapaan ikä- 
luokka, sukupuoli ja yksilövariaatio. Oletuksena on, että rakenteellinen 
kompleksisuus lisää myös T-yksikön sanamäärää. 
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FINIITTISET JA EI-FINIITTISET VERBIT 

Yleisesti ottaen mitä enemmän kirjoittaja käyttää finiittisiä muotoja, sen 
yksinkertaisempaa — ja oletettavasti puhutun kielen rakenteen mukai- 
sempaa — tekstiä hän tuottaa. Mitä enemmän hän käyttää ei-finiittisiä 
muotoja, sen kompleksisempaa ja kehittyneempää — edelleen oletuksen 
mukaan — hänen kielenkäyttönsä on. Verbisanaluokka on alaluokiteltu 
finiittifunktiossa käytettyihin verbimuotoihin (olen, en [ole], ollaan) sekä 
ei-finiittisiin muotoihin, jotka on edelleen jaettu verbin rektioinfinitii- 
veihin sekä muihin (e-infinitiivi, partisiipit sekä verbin kieltomuoto). 
Verbin hallitsemista ei-finiittisistä monet ovat modaaliverbien yhtey- 
dessä käytettyjä leksikaalisia verbejä. Muut ei-finiittiset koostuvat pää- 
asiassa verbin liittomuodoista mutta myös eri lauseenvastikkeista. Tämä 
viimeinen muut-ryhmä on kehityksellisesti mielenkiintoisin, koska sekä 
liittotempukset, kieltomuodot että lauseenvastikkeet lisääntyvät perus- 
koululaisten kirjoitelmissa kehityksellisesti (vrt. Pajunen 2012). Tosin 
voi olla, että kiellon osalta vähäisyys liittyy unelmakontekstiin. 

Finiittiverbien osuus koko verbimäärästä laskee nuorimpien keski- 
määrin 80 prosentista vanhimpien runsaaseen 6o prosenttiin eli suun- 
nilleen 20 prosenttiyksikköä. Ero on merkitsevän suuri. Lehtikielessä 
finiittiosuus on 62,1 prosenttia. Peruskoulussa pojilla on finiittiverbejä 
hieman enemmän kaikista verbiesiintymistä kuin tytöillä ja nuorilla ai- 
kuisilla tilanne on päinvastainen, vaikka ero on pieni. Yksilöllinen vaih- 
telu on finiittiverbienkin osuudessa suuri (taulukko 65). Peruskoululai- 
sista kuudesluokkalaisilla ja yhdeksännen pojilla on lähes finiittiverbien 
varassa eteneviä kirjoitelmia vielä aika paljon (ja yli odotuksen), nuoril- 
la aikuisilla sen sijaan ei lainkaan. Ryhmä 60-69 prosenttia verbeistä 
finiittisiä kasvaa selvimmin iän mukaan ja kattaa aikuisilla yli puolet 
kirjoitelmista. Tässäkin muuttujassa miehillä tilanne kääntyy aikuisiällä 
päinvastaiseksi, sillä nyt naisilla on vallitsevasti finiittiverbillisten kirjoi- 
telmien osuus korkeampi kuin miehillä. 

Finiittiverbien määrä vaikuttaa selvästi T-yksikön keskipituuteen ja 
kompleksisuuteen. Ero on selvin lapsilla ja nuorilla aikuisilla mutta päin- 
vastainen (ks. kaaviot 30 ja 31). Peruskoululaisilla korkea finiittiverbien 
määrä laskee T-yksikön sanamäärää ja kompleksisuusindeksiä: kerto- 
mus voi edetä yksinkertaisin peruslausein. Aikuiskirjoittajilla sekä sa- 
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Taulukko 65. Finiittisten verbien tiheys Unelmakorpuksessa. 


Tkäluokka / Yli = 80-90 70-79 60-69 50-59 20-49 % 
Kirjoitelma % 90 
Kuudes F 5,6 26,9 43,1 20,0 4,4 o 
Kuudes M 8,5 31,4 28,7 21,6 5,9 3,9 
Yhdeksäs F 1,1 12,5 38,6 32,9 14,8 o 
Yhdeksäs M 6,9 16,6 43,1 22,2 11,1 o 
Aikuiset F o 0,4 23,4 51,0 23,4 i7 
Aikuiset M o 1,0 12,4 54,6 31,9 o 
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Kaavio 30. Verbeistä finiittisia ja T-yksikköjen sanamäärä. Finiittiverbien mediaani- 
osuus: kuudes 75,3 ja 77,8, yhdeksäs 70,6 ja 73,9 sekä aikuiset 65,1 ja 63,2. 


namäärä että rakenteen kompleksisuus nousevat finiittiverbien määrän 
noustessa. Sama linja näkyy jo yhdeksäsluokkalaisilla mutta heikkona. 
Erot syntynevät sivulauseista. Kuudennella on paljon kirjoitelmia, joissa 
sivulauseita on hyvin vähän, jolloin finiittiverbi esiintyy yksinkertaises- 
sa T-yksikössä. Vanhemmilla kirjoittajilla sivulauseet kattavat jo puo- 
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Kaavio 31. Verbeistä finiittisiä ja kompleksisuusindeksi. Finiittiverbien mediaani- 
osuus: kuudes 75,3 ja 77,8, yhdeksäs 70,6 ja 73,9 sekä aikuiset 65,1 ja 63,2. 


let kaikista alisteisista aineksista, joten T-yksikkö on monilauseinen. 
Kehityksellisesti ero finiittiverbien osuudessa on aineiston suurimpia. 
Sukupuolen mukaan tilanne ei eroa kovin paljoa paitsi, että mieskirjoit- 
tajilla on ääriarvoja enemmän. — Finiittiverbien mediaaniosuus kaikista 
verbimuodoista on kuudensilla 75,3 ja 77,8, yhdeksänsillä 70,6 ja 73,9 
sekä aikuisilla 65,1 ja 63,2. 

Verbin hallitsemien rektioinfinitiivien osuus nousee Unelmakorpuk- 
sen kirjoitelmissa kehityksellisesti. Keskeisin tiheysluokka on 11-20 
prosenttia verbiesiintymistä rektioinfinitiivejä (ks. taulukko 66). Tätä 
pienempi ja suurempi luokka pienenee iän mukaan. Sukupuolen mu- 
kaan muutos menee taas kerran hieman eri tavoin. Kuudennen tytöillä 
rektioinfinitiivien määrä on luokassa o>10 prosenttia muihin verrattuna 
suuri, ja suuremmissa luokissa miesten luvut ovat usein korkeammat 
kuin naisten. Peruskoulun pojilta rektioinfinitiivit voivat puuttua koko- 
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Taulukko 66. Rektioinfinitiivien tiheys Unelmakorpuksessa. 


Tkäluokka / o 0>10 11-20 21-30 31-40 Yli 40 % 
Kirjoitelma % 
Kuudes F 1,2 33,7 46,9 15,6 L9 0,6 
Kuudes M 9,8 17,6 41,2 17,0 85 5,9 
Yhdeksäs F I 20,4 45,4 26,1 6,8 o 
Yhdeksäs M 2,8 13,9 50,0 26,4 55 1,4 
Aikuiset F o 18,5 65,5 14,3 1,7 o 
Aikuiset M o 15,3 58,2 24,5 2,0 o 
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Kaavio 32. Rektioinfinitiivit ja T-yksikköjen sanamäärä. Rektioinfinitiivien me- 
diaani: kuudes 13,7 ja 14,3, yhdeksäs 14,3 ja 15 sekä aikuiset 14,5 ja 15,9. 


naan, kuudennen pojilla epäodotuksenmukaisen usein (lähes 10 % odo- 
tuksenmukaisen 2-3 % sijaan). Lehtikielessä rektioinfinitiivien osuus 
verbiesiintymistä on 14,3 prosenttia. 

T-yksikön keskipituus nousee rektioinfinitiivien määrän kasvaessa 
ja eritoten aikuisryhmässä (ks. kaavio 32), mutta kasvua on vähän yh- 
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Kaavio 33. Rektioinfinitiivit ja kompleksisuusindeksi. Rektioinfinitiivien mediaa- 
ni: kuudes 13,7 ja 14,3, yhdeksäs 14,3 ja 15 sekä aikuiset 14,5 ja 15,9. 


deksännen pojilla. Vastaavasti rakenteen kompleksisuus kasvaa rektio- 
infinitiivien myötä kaikilla ikäryhmillä (ks. kaavio 33) mutta merkityksel- 
lisimmin aikuisryhmissä. Tilanne on samantapainen nais- ja mieskirjoit- 
tajilla, mutta nostava vaikutus on melko pieni kuudennen luokan tytöillä 
ja yhdeksännen pojilla. Kuudennen tytöillä on paljon yksinkertaisia ra- 
kenteita, ja osa yhdeksännen pojista on ollut alle ikäluokan tason mo- 
nessa. — Rektioinfinitiivien mediaani on kuudensilla 13,7 ja 14,3, yhdek- 
sänsillä 14,3 ja 15 sekä aikuisilla 14,5 ja 15,9. 

Finiittiverbien ja rektioinfinitiivien lisäksi verbeihin kuuluu joukko 
muita verbimuotoja: e-infinitiivi (juosten, tankatessa), verbin kieltomuoto 
([en] ole) ja partisiipit. Kehityksellinen ero tulee näkyviin myös, kun kat- 
sotaan näiden muiden jäljelle jääneiden osuutta kaikista verbiesiinty- 
mistä (ks. taulukko 67). Nuorimmilla muita verbifunktioita on eniten 
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Taulukko 67. Muiden ei-finiittisten verbimuotojen tiheys Unelmakirjoitelmissa. 


Tkäluokka / o 1-5 6-10 11-15 16—20 Yli 20 % 
Kirjoitelma % 

Kuudes F 81 15,0 32,5 25,6 12,5 6,2 
Kuudes M 26,8 18,9 26,1 15,0 7,8 5,2 
Yhdeksäs F 5,7 7,9 22,7 20,4 20,4 227 
Yhdeksäs M 19,4 9,7 25,0 23,6 12,5 9,7 
Aikuiset F o o 6,3 13,4 34,4 45,8 
Aikuiset M o 2,0 4,1 17,3 26,5 50,0 


yleisyysluokassa 6-10 prosenttia verbeistä; vanhimmilla taas yleisyys- 
luokassa yli 20 prosenttia. Sukupuolen mukaan on edelleen näkyvissä 
huojuntaa. Kuudennella on poikia, joiden kielenkäyttötaidot ovat selvästi 
ikäluokasta jäljessä. Yhdeksännellä on vastaava ryhmä, josta ei voi tie- 
tää, mikä ongelmia aiheuttaa, todennäköisesti sekä puutteet taidoissa 
että asenne ja/tai ulkoinen motivaatio. On syytä taas muistuttaa, että 
nämä samat kuudennen ja yhdeksännen pojat pärjäsivät lähes tyttöjen 
veroisesti tai paremmin morfologisessa ja semanttisessa testauksessa, 
joten kyse ei ole yksin kielenhallinnasta (vrt. Truckenmiller & Petscher 
2020). Lehtikielessä muiden verbiesiintymien osuus on 23,5 prosenttia 
eli tässäkin nuoret aikuiset ovat lähellä lehtikielen ominaisuuksia. 

Muut verbimuodot nostavat T-yksikön keskipituutta voimakkaasti 
kuudesluokkalaisilla sekä yhdeksännen pojilla, muilla vaikutus on vähäi- 
sempi ja aikuisilla selvästi laskeva (ks. kaavio 34). Vastaavasti ne nostavat 
ja toisaalta laskevat kompleksisuutta samoissa ryhmissä (ks. kaavio 35), 
mikä erityisesti aikuisten osalta tuntuu ensin hämmästyttävältä. Laskeva 
vaikutus liittynee partisiippien monifunktioisuuteen. Muista verbimuo- 
doista partisiippien osuus on suurin ja aikuisten partisiipeista kolme 
neljäsosaa on muissa funktioissa kuin lauseenvastikkeiden predikaatti- 
na. Vain lauseenvastikkeiden odottaisi nostavan kompleksisuutta. — Mui- 
den verbimuotojen mediaanit ovat kuudensilla 9,5 ja 5,5, yhdeksänsillä 
13,7 ja 9,2 sekä aikuisilla 19,4 ja 19,7. 
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Kaavio 34. Muut ei-finiittiset ja T-yksikköjen sanamäärä. Muiden verbimuotojen 
mediaanit: kuudes 9,5 ja 5,5, yhdeksäs 13,7 ja 9,2 sekä aikuiset 19,4 ja 19,7. 


Yksilötasolla lauseenvastikkeet nostavat nuorten aikuisten kirjoitelmissa 
kompleksisuutta, vaikka se ei keskiluvuista vielä tullut ilmi. Esimerkin 
12 kirjoitelmassa on kaikkiaan 14 muuta ei-finiittistä muotoa. Toisaalta 
muiden ei-finiittisten määrä voi olla korkea ilman, että kompleksisuus 
on korkealla, jos käytössä on paljon tempusta ilmaisevia partisiippeja 
(ks. esimerkki 13). 


Kompleksisuusindeksi = 1,74, muiden ei-finiittisten osuus verbeis- 
tä = 37,1 prosenttia: 

12) Korkealla sillalla näkymä siniselle Välimerelle tulee näkyviin vielä 
viimeisen kerran ja sitten katoaa tien kaartuessa sisämaahan. — — Py- 
sähdys pienellä huoltoasemalla tuskin housuissaan pysyvän nuorten 
miesten tankatessa autoja ja toinen idyllisen pikkukylän kahvilassa 
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Kaavio 35. Muut ei-finiittiset ja kompleksisuusindeksi. Muiden verbimuotojen 
mediaanit: kuudes 9,5 ja 5,5, yhdeksäs 13,7 ja 9,2 sekä aikuiset 19,4 ja 19,7. 


cappuccinon ja voisarven kera. Auringon alettua jo laskeutua avautuu 
edessä näkymä Comon vehreille kukkuloille ja kauas horisonttiin jat- 
kuvaan ——. (AMKM43) 


Kompleksisuusindeksi = 1,29, muiden ei-finiittisten osuus verbeis- 
tä = 29,1 prosenttia: 

13) Olen koko elämäni haaveillut omasta täydellisestä hääpuvustani, 
maailman sädehtivimmästä timanttisormuksesta ja ikimuistoisesta 
hääjuhlasta.- -Vaikka avioliitto ei ole minulle elämän keskipiste, olen 
kuitenkin täysin ihastunut häihin juhlana, suomalaiset häät on yksin- 
kertaisesti täydellinen juhla kaikkine perinteineen. (PääsyF255) 
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Lopuksi voi todeta, etta finiittiverbien ja ei-finiittisten ainesten suhde 
on käänteinen. Finiittiverbien määrä laskee kehityksellisesti 30 pro- 
senttiyksikköä ja vastaavasti ei-finiittisten nousee. Ei-finiittiset ainekset 
eivät kuitenkaan sijoitu aina samoihin kirjoitelmiin vaan jakaantuvat 
alatyyppien mukaan. Rektioinfinitiivit ovat yleisiä tulevaisuuteen viit- 
taavissa kirjoitelmissa, mutta partisiippien määrä nousee menneestä 
kertovissa. Ei-finiittiset ainekset nostavat selvästi rakenteen (ja tietysti 
myös verbimuodon) kompleksisuutta mutta erot ovat usein selvimmät 
yksilötasolla. 

Fi-finiittisten ainesten nousua selittävät pitkälti verbiluokan laadulli- 
set erot. Kehityksellisesti lisääntyvät erityisesti lauseargumentin kanssa 
järjestyvät eli mentaaliverbit ja puheaktiverbit (esimerkiksi tuntea; nähdä, 
kuulla; ajatella; sanoa; ks. Pajunen 2001) tekoja, tapahtumia ja tiloja suo- 
raan kielentävien kustannuksella. Kaikki lauseargumentin sallivat verbit 
ovat syntaksiltaan ja semantiikaltaan kompleksisia. Ne kielentävät propo- 
sitionaalisia asenteita, niillä referoidaan toista ääntä, ilmaistaan abstrak- 
teja tunteita ja niin edelleen. Tekstitasolla lauseargumentti voi reaalistua 
komplementtilauseena, eri- tai samasubjektisena infinitiivinä tai parti- 
siippirakenteena (esimerkiksi luulin että; ajattelin mennä, käskin heidän 
lähteä; luulin olevani). Näiden verbien osuus kasvaa kehityksellisesti kuu- 
dennelta yhdeksännelle ja edelleen nuoriin aikuisiin (ks. myös Muho- 
nen 2019; Tiiro 2021). Kaikista verbiesiintymistä mentaali- ja puhe- 
aktiverbien esiintymien osuus on kuudennella 16 prosenttia ja yhdek- 
sännellä 18 prosenttia mutta nuorilla aikuisilla jo yli 22 prosenttia, eli 
lisääntyminen samantapaisissa kirjoitelmissa on tasaista (ks. taulukko 
68). Myös ryhmän sisäiset suhteet muuttuvat: kuudesluokkalaisilla ryh- 
män verbeistä 40 prosenttia on puheaktiverbejä, yhdeksäsluokkalaisilla 
noin kolmannes ja nuorilla aikuisilla enää vajaa neljännes (ks. taulukko 
69). Erityisesti evaluoivien mentaaliverbien osuus kasvaa kehitykselli- 
sesti, mutta referoivien puheaktiverbien osuus laskee. Tämä tarkoittaa 
Niinimäen luvussa esitettyä analyysiä mukaillen, että hieman vanhem- 
mat kirjoittajat pohtivat asioita, esittävät omia mielipiteitään ja ilmai- 
sevat tunteitaan, mutta nuoremmat kirjoittajat referoivat puheakteja. 
Mentaaliverbeistä joka ryhmässä käytetään eniten kognitioverbejä, mut- 
ta ainoastaan emootioverbien määrä kasvaa lineaarisesti. Lehtikielessä 
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mentaaliverbien osuus on hieman suurempi kuin kirjoitelmissa mutta 
lähellä nuorten aikuisten osuutta. Sen sijaan puheaktiverbien osuus on 
suurempi ja tämä johtuu luonnollisesti lehtikielen runsaasta referoin- 
nista. 


Taulukko 68. Mentaali- ja puheaktiverbien osuus verbiesiintymistä ja kokonaissana- 
määrästä. 


Ikäluokka / Mentaali- ja Verbiesiintymistä Kokonaissanamäärästä 
puheaktiverbi % % 
Kuudes 16 45 
Yhdeksäs 18 5 
Aikuiset 22,3 6,1 
Lehtikieli 23,7 5 


Taulukko 69. Esiintymien jako mentaali- ja puheaktiverbeihin. 


Ikäluokka / Verbiluokka Mentaaliverbiesiintymat Puheaktiesiintymät 
% % 

Kuudes 59,1 40,9 

Yhdeksäs 71,8 28,1 

Aikuiset 76,8 23,1 

Lehtikieli 64,1 35,8 


FINIITTIVERBILLISET SIVULAUSEET 

Myös T-yksikön alisteiset, finiittiverbin sisältävät lauseet nostavat syntak- 
tisen rakenteen kompleksisuutta. Niiden määrä nousee kehityksellisesti 
oletettavasti, koska rinnastus on ensisijaista tai helpompaa kuin alistus 
(ks. Itkonen 2009, 189). Nahkola (2012, 42) analysoi alakoululaisten 
Koulukorpuksen kirjoitelmia (luokat 1.-6.) ja osoittaa, että rinnastus- 
konjunktioiden osuus lauseita yhdistävistä elementeistä laskee ensim- 
mäiseltä kuudennelle 15 prosenttiyksikköä, adverbiaalisten elementtien 
osuus nousee kymmenisen prosenttiyksikköä ja relatiivisten osuus 
kahdentuu vajaasta viidestä kymmeneen prosenttiin. Adverbiaalisista 
eniten lisääntyvät kontrastiivista, kausatiivista ja finaalista funktiota il- 
maisevat; temporaalikonjunktiota käytetään adverbiaalisista silti eniten 
(Nahkola 2012, 44). Vielä aikuisillakin temporaaliset ja kausaaliset ad- 
verbiaalilauseet vallitsevat (Tiiro 2021, 59). Ja vaikka rinnastuksen rooli 
heikkenee alakoulun aikana, rinnastus on toki kaikkein yleisin tapa yh- 
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distää lauseita (noin 50-60 %). Tietysti myös kyky rinnastaa lauseita 
on kehityksellistä, minkä oivaltaa nopeasti, kun tarkastelee nuorimpien 
kirjoittajien atomistisia lauseluetteloita. Tarkastelemme tässä yhteydes- 
sä peruskoulun kuudes- ja yhdeksäsluokkalaisten alisteisten lauseiden 
määriä ja funktioita ja vertaamme niitä nuorten aikuisten vastaaviin. 
Joitain vertailuja esitämme myös vastaavista lauseenvastikkeista, mutta 
ne perustuvat rajatumpaan aineistoon. Lisäksi esitämme joitain vertai- 
lulukuja lehtikielen lauserakenteista, mutta ne perustuvat jossain mää- 
rin arvioihin. 

Lauseita yhdistävät elementit koostuvat kirjoitelmissa konjunktioista 
ja relatiivi- ja interrogatiivipronomineista. Konjunktiot on edelleen luo- 
kiteltu yksinkertaisen kielioppiluokituksen mukaan alisteisiin ja rinnas- 
teisiin. Kaikki alistavalla elementillä alkavat lauseet nostavat lauseraken- 
teen kompleksisuutta. Rinnastavat on tässä jätetty käsittelemättä, koska 
ne merkitään vaihtelevasti T-yksiköihin.”* Tarkastelemme erikseen alis- 
teisten sivulauseiden jakaumaa komplementtilauseisiin (todennäköi- 
simmät argumenttiasemaiset sivulauseet, sanoi että), relatiivilauseisiin 
sekä temporaalisiin, kausaalisiin, ehtoa ilmaiseviin ja muihin niin sanot- 
tuihin adverbiaalisiin alistuslauseisiin. Monista kielistä on esitetty, että 
juuri relatiivilauseiden määrä lisääntyisi kehityksellisesti (ks. Berman & 
Verhoeven 2002, 34-35), mutta suomen osalta alakoulussa adverbiaali- 
lauseiden määrä nousi vielä enemmän kuin relatiivilauseiden (ks. Nah- 
kola 2012, 42). Alisteisten sivulauseiden funktioita analysoitaessa on 
syytä muistaa, että alistuskonjunktio ei aina kerro, missä funktiossa 
lause T-yksikössä on (vrt. Herlin 1998; Visapää 2012; Cristofaro 2014). 


125 Kuudesluokkalaisten osalta analyysissä ovat mukana vain ne kuudesluokkalaisten kirjoitelmat, jotka 
ovat kertomusmaisia eli noin 60 % kaikista kirjoitelmista (Muhonen 2019). Aikuisten osalta mukana 
on vain ammattikorkeakoululaisten aineisto eli noin kolmasosa aikuisaineistossa (Tiiro 2021). Tosin 
Tiiron aineisto jakautuu tasan sukupuolen mukaan. Rajatummasta aineistosta lasketut luvut eivät 
täysin vastaa kaikkia koko aineistosta laskettuja. Esimerkiksi lauseenvastikkeiden määrä on Muhosella 
korkeampi kuin koko kuudennen aineistossa ja kaikilla aikuisilla hieman matalampi kuin Tiiron aikui- 
silla. 

126 Jos subjekti ilmaistaan verbin persoonataivutuksella, rinnasteiset lauseet kuuluvat eri T-yksiköihin 
(esimerkiksi menen ja teen), toisin kuin esimerkiksi englannissa (vrt. Schneider ja muut 2005). 
Kolmannessa persoonassa vastaava ei ole mahdollista ja rinnasteiset lauseet kuuluvat nyt samaan 
T-yksikköön (hän menee ja tekee). 
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Aineiston kuudesluokkalaisten T-yksiköitä analysoinut Muhonen (2019) 
toteaa, että konjunktioiden käytössä on vielä vakiintumattomuutta. 

Alisteisten sivulauseiden tiheys on laskettu kirjoitelman kokonais- 
sanamäärästä koehenkilöittäin (ks. taulukko 70). Valtaosalla peruskoulu- 
laisista on kirjoitelmassaan 1-5 alisteista sivulausetta. Kuudennella on 
vielä iso ero tyttöjen ja poikien välillä, mutta se tasaantuu jonkin verran 
yhdeksänteen mennessä. Aikuiskirjoittajista noin puolella on 1-5 ja 
puolella 6-10 sivulausetta; sukupuoliero sivulausetiheydessä on pie- 
ni. Sivulauseiden määrä toisin sanoen kasvaa selvän kehityksellisesti. 
Myös Kauppinen (1976), Vikainen (1982), Lundin (1983), Närhi (1990) 
ja Virolainen (2003) ovat todentaneet tämän kehityksen varhaisemmis- 
ta koululaiskirjoitelmista. Samalla tutkimukset myös osoittavat, että si- 
vulauseiden osuus kaikista lauseista on kuitenkin jatkuvasti laskenut. 
Muhonen (2019) toteaa selvän eron vuosien 2006 ja 2014 kuudesluok- 
kalaisten (kertomusmaisissa) Unelmakirjoitelmissa sekä määrissä että 
hierarkkisuudessa. 

Lauseenvastikkeiden väheneminen on ollut erityisen suuri. Virolaisen 
2000-luvun kirjoitelmissa lauseenvastikkeita on yhdeksäsluokkalaisilla 
4,5 prosenttia kaikista lauseista mutta Närhin 1980-luvun aineistossa 
jopa 15,5 prosenttia. Tuloksia ei voi suoraan verrata tämän tutkimuksen 
aineistoon, mutta jos otetaan huomioon T-yksikköjen keskimääräinen 
kompleksisuus, voidaan Tiiron (2021) ja Muhosen (2019) laskelmien 
perusteella arvioida, että kuudesluokkalaisilla on lauseenvastike 0,9 
prosentissa kertovan tekstin lauseista (T-yksikköjä 4 327 x CI 1,55) ja 
aikuisilla 7,8 prosentissa (T-yksikköjä 3 868 x CI 1,67). Unelmakirjoitel- 
missa tosin kaikenikäisillä kirjoittajilla on ongelmia niin sivulauseiden 
rinnastamisessa kuin lauseenvastikkeiden muodostamisessa ja käytössä. 
Toisin sanoen vaikka sivulauseiden ja lauseenvastikkeiden määrä kas- 
vaa koehenkilöillä kehityksellisesti, kyky muodostaa niitä on heikennyt. 
— Sanomalehtikielessä näyttäisi joka kolmannessa virkkeessä olevan yksi 
alisteinen lause. 
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Taulukko 70. Alisteisten lauseiden tiheys Unelmakirjoitelmissa ikäluokittain. 


Ikäluokka / Kirjoitelma % o kpl 1-5 6-10 11-15 Yli 15 
Kuudes F o 70 26,8 1,9 1,3 
Kuudes M 8,5 54,6 24,3 7,2 5,3 
Yhdeksäs F 3,4 79,5 15,9 LI o 
Yhdeksäs M 8,3 69,4 18 2,8 1,4 
Aikuiset F o 50,4 471 255 o 
Aikuiset M I 53,1 43,9 2 o 


Sivulauseiden (n = 5 787) alaluokittelu osoittaa, että juuri relatiiviset 
sivulauseet lisääntyvät kehityksellisesti myös suomen kielessä, toisin 
sanoen jo kuudennelta alkava kehitys jatkuu aikuiskirjoitelmiin (ks. 
taulukko 71). Ero kuudes- ja yhdeksäsluokkalaisten välillä on lähes kah- 
deksan prosenttiyksikköä, kuudesluokkalaisten ja aikuisten välillä yli 
13 prosenttiyksikköä ja yhdeksäsluokkalaisten ja ammattikorkeakoulu- 
laisten välillä kuusi prosenttiyksikköä, yhdeksäsluokkalaisten ja pääsy- 
kokeeseen osallistuneiden välillä ero on vain kolme prosenttiyksikköä. 
Pääsykoeaineiston kirjoittajat ovat pääosin naisia, ammattikorkeakoulu- 
laisten aineistossa on miehiä ja naisia yhtä paljon. Komplementtilauseis- 
sa muutos ei ole lineaarinen, mutta sen sijaan adverbiaalilauseiden mää- 
rä laskee lineaarisesti. 


Taulukko 71. Alisteisten lauseiden jakauma funktioittain ja ikäluokittain Unelmakorpuk- 
sessa. 


Tkäluokka / Komplementtilause = Adverbiaalilause Relatiivilause 
Sivulausetyyppi % 

Kuudes F 22 59,8 18,2 
Kuudes M 2251 55 22,8 
Yhdeksäs F 24,4 43 32,6 
Yhdeksäs M 24 43,4 32,6 
Aikuiset F 21 42,8 36,2 
Aikuiset M 17,9 40,6 41,4 


Komplementtilauseiden määrissä ei näy suuria kehityksellisiä eroja eri 
ikäluokkien välillä toisin kuin niiden alatyypeissä. Nuorimmilla kir- 
joittajilla että-lause on vallitseva komplementtilauseen tyyppi (Nahkola 
2012, 36; Muhonen 2019, 36), mutta vanhemmilla kirjoittajilla epäsuora 
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kysymyslause ja samanaikaista tekemistä ilmaiseva lauseenvastike li- 
sääntyvät. Tämä on oletetun kompleksistumiskehityksen mukaista (ks. 
Noonan 2007, 114-115). Lisäksi kuten Niinimäki osoittaa tässä teoksessa, 
suora esitys laskee selvän kehityksellisesti kuudennelta aikuisryhmiin ja 
että-lauseella ilmaistu epäsuora esitys kasvaa. Samalla komplementtia 
hallitsevan verbin tyyppi muuttuu puheaktista evaluointia ilmaiseviin 
kognitioverbeihin ja tämäkin muutos on kehityksellinen. 

Myös relatiivilauseiden funktioissa ikä tuo mukanaan eroja. Tiiron 
(2021) mukaan kuvailevia (rajaavia ja ei-rajaavia) relatiivilauseita on ai- 
kuisilla eniten (65 % kaikista), lähinnä narratiivisia, tarinaa eteenpäin 
vieviä on vajaa kolmannes, ja loput ilmaisevat subjektiivista mielipidettä. 
Erityisesti narratiiviset relatiivilauseet näyttävät lisääntyvän aikuiskirjoit- 
tajilla kuudesluokkalaisiin verrattuna (Muhonen 2019), vaikka aikuiskir- 
joittajilla on kaikkia relatiivilauseen tyyppejä enemmän kuin kuudes- 
luokkalaisilla. Ero vaihtelee 5-10 prosenttiyksikköä. Relatiivilauseissa 
myös ei-lineaariset rakenteet eli kiilalauseet lisääntyvät; niitä on aikuis- 
teksteissä noin viisi prosenttia kaikista relatiivilauseista (Tiiro 2021). 
Muissa sivulausetyypeissä ei-lineaariset rakenteet ovat poikkeuksellisia. 

Adverbiaalilauseista enemmistö eli neljä viidestä on aikuisilla joko 
temporaalisessa tai kausaalisessa funktiossa ja ne ovat yhtä yleisiä (Tiiro 
2021, 60). Kuudennella adverbiaalilauseista yli Go % on temporaalisia 
(Muhonen 2019, 30-32), mutta kausaaliset kasvavat selvän kehitykselli- 
sesti. Temporaalisten lauseiden ja etenkin lauseenvastikkeiden funktio 
on kerronnallinen ja koherenssia luova silloin, kun ne sijaitsevat päälau- 
seen edellä; 30 prosenttia temporaalisista sivulauseista ja 70 prosenttia 
vastaavista lauseenvastikkeista on etuasemaisia. Taka-asemaisten funk- 
tio on kuvailla tai täydentää. Tiiron mukaan temporaalilauseen asema 
vaikuttaa myös sen aikasuhteeseen: etuasemassa oleva ilmaisee useim- 
miten peräkkäistä aikasuhdetta (esimerkiksi syötyäni menin nukku- 
maan), taka-asemassa oleva ennemmin päällekkäistä (esimerkiksi luin 
syödessäni). Kehityksellisesti peräkkäisiä suhteita ilmaistaan ennen pääl- 
lekkäisiä (Aksu-Koc & von Stutteheim 1994, 392; Tiiro 2021, 67). 

Sivulauseiden funktioiden muutokset eivät vaikuta T-yksiköiden sa- 
namääriin tai kompleksisuusindeksiin toisin kuin niiden määrän kasvu, 
mutta lauseenvastikkeet voivat pudottaa T-yksikön sanamäärää. Sanoma- 
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Kaavio 36. Alisteiset sanamäärästä ja kompleksisuusindeksi. Alistavien mediaani: 
kuudes 3,7 ja 3,2, yhdeksäs 3,5 ja 3,3 sekä aikuiset 3,5 ja 3,8. 


lehtikielen miljoonan sanan otoksessa relatiivi- ja adverbiaalilauseiden 
osuudet ovat lähellä nuorten aikuisten lukuja (35 % ja 37 %) mutta 
komplementtilauseita on 10 prosenttiyksikköä enemmän lehtikielessä 
kuin nuorilla aikuisilla. Syynä lienee jälleen sanomalehtikielen referoin- 
nin tarve, joka jo todettiin edellä puheaktiverbien yhteydessä. 
Kuudesluokkalaisten ja aikuisten aineistossa on selvät sukupuolen 
mukaiset erot sivulauseiden funktioissa: naiskirjoittajat käyttävät enem- 
män adverbiaalilauseita, mieskirjoittajat relatiivilauseita. Aikuisaineis- 
tossa on yli viiden prosenttiyksikön ero juuri relatiivilauseiden määrissä, 
ja jo tämä voisi selittää aikuisten mieskirjoittajien korkeampaa komplek- 
sisuusindeksiä. Yhdeksäsluokkalaisten aineistossa ei ole sukupuolen 
mukaan selittyviä eroja, vaikka hyvin monissa muissa kompleksisuus- 
muuttujissa juuri yhdeksännen pojat ovat eronneet yleiskuvasta. Lau- 
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seenvastikkeet kuuuluvat selvästi mieskirjoittajien kieleen (Tiiro 2021). 
Kaikilla kirjoittajilla sekä MLTU että kompleksisuusindeksi (ks. kaavio 
36) nousevat alistavien sivulauseiden lisääntymisen myötä, nousu on 
suurinta aikuiskirjoittajilla ja pienintä kuudennen tytöillä.?? — Alista- 
vien sanojen mediaaniosuus kaikista sanoista on kuudensilla 3,7 ja 3,2, 
yhdeksänsillä 3,5 ja 3,3 sekä aikuisilla 3,5 ja 3,8. 

Peruskoululaisten ja aikuisten välillä on siis eroa sivulauseiden mää- 
rissä ja funktioissa. Lisäksi aineistoa selailemalla näkee nopeasti, että 
etenkin kuudesluokkalaisilla on vielä paljon epävarmuutta paitsi kon- 
junktioiden valinnassa myös lause- ja virkerakenteiden luomisessa (sa- 
moin Muhonen 2019). Kuudennen esimerkkitekstit 14-15 ovat melko 
pitkiä, ja ne ovat suunnilleen ikätasoisten tyttöjen kirjoittamia. Esimer- 
kissä 14 virkerakenne on toisteinen, mikä näkyy muun muassa relatiivi- 
lauseista. Esimerkki 15 edustaa aikajärjestyksessä etenevää yksinkertaista 
rakennetta. 


Kompleksisuusindeksi = 1,67, alisteisia 15, rinnasteisia 2, sanoja 279: 
14) Mario taas kiinnitti huomionsa aivan muuhun. Hän oli suoraan 
pulahtanut veteen ja uinut pienelle saarelle, joka kökötti aivan järven 
keskellä. Minä hyppäsin veteen hyppytornin korkeimmasta kohdasta. 
Kun olin hypännyt veteen niin lähdin uimaan kohti saarta missä Ma- 
rio odotteli minua. Lopulta parin minan kuluttua pääsin saarelle, jossa 
Mario odotteli minua. Mario, joka oli peläyttämässä minua plumpahti 
veteen, koska oli kiivennyt puuhun ja oksa oli katkennut. Minä aloin 
nauramaan suu kuivana hänelle, Mario oli nolona, koska rannalla oli 
poikia, jotka katsoivat meitä iloisina. (6F25). 


Kompleksisuusindeksi = 1,09, alisteisia 2, rinnasteisia 1, sanoja 241: 
15) Aamupalan jälkeen menemme talliin ja puunaamme hevoset ja läh- 
demme maastolenkille. Maastolenkin varrella on pieni lampi ja pysäh- 
dyimme uittamaan hevosia siihen. Olimme uimassa n. yhden tunnin 
ja sen jälkeen jatkoimme matkaa. Maastolenkin jälkeen veimme hevo- 


127 Kaavioon 36 ei ole erikseen huomioitu lauseenvastikkeita. Ne nostaisivat erityisesti mieskirjoittajien 
Cl-indeksia. 
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set talliin. Tallissa me siivosimme karsinat ja teimme kaikki tallityöt, 
pistimme hevoset laitumelle ja menimme itsekin syömään. Ruoaksi oli 
pizzaa ja minulle tietysti gluteinitonta koska olen keliaakikko. Loppu 
päivällä ratsastimme kentällä ja kaikki meni hyvin. Aika loppui hie- 
man kesken, mutta siinä oli suurin osa siitä päivästä. (6F28) 


Kompleksisuus kehityksellisesti: mikä nostaa tai laskee 
kompleksisuutta 


Tarkastelemme lopuksi kompleksisuuden kehityksellistä nousua ver- 
tailemalla keskeisten sanaluokkaesiintymien, verbaalisten kompleksi- 
suustekijöiden sekä eräiden muiden indeksien suhteellisen osuuden ja 
arvojen vaikutusta T-yksikön keskipituuden (MLTU) ja kompleksisuu- 
sindeksin (CI) mediaanin mukaan jaotellen. 

Sanaluokista on otettu huomioon adjektiivit, substantiivit ja pronomi- 
nit sekä verbit ja verbeistä erikseen infinitiivit ja partisiipit. Esiintymä- 
osuudet on jaettu sen mukaan, miten ne sijoittuvat MLTU:n mediaanin 
ala- tai yläpuolelle. Kuudennella mediaani on 6, yhdeksännellä 6,2 ja 
nuorilla aikuisilla 7,4 (ks. taulukko 72). Tulos on, että infinitiivejä, ad- 
jektiiveja ja pronomineja on enemmän yli mediaanin tapauksissa, joten 
voi olettaa, että näiden sanaluokkien jäsenet voivat nostaa T-yksikkö- 
jen keskimääräistä sanamäärää. Verbien suhteellinen osuus sen sijaan 
laskee yli mediaanin tapauksissa joka ikäluokassa. Partisiippien määrä 
nousee aikuisryhmässä mutta vaikutus MLTU:n sanamäärään on pieni. 
Substantiiveja on enemmän silloin, kun MLTU on alle ikäluokan me- 
diaanin. Tämä on hieman epäodotuksenmukaista, koska sekä leksikaali- 
nen tiheys että NTVR nousevat kehityksellisesti; substantiivit vaikuttavat 
näissä molemmissa eniten. Ikäryhmittäin erot eri sanaluokkien jäsenten 
esiintymämäärissä eivät ole niin suuret, että ne voisivat huomattavasti 
vaikuttaa T-yksiköiden keskipituuteen verbejä ehkä lukuun ottamatta. 
Verbien määrä laskee kehityksellisesti, ja vastaavasti substantiivien, 
adjektiivien ja pronominien määrä nousee. Infinitiivien määrä laskee 
kehityksellisesti, mikä tuntuu epäodotuksenmukaiselta. Lasku kuitenkin 
selittyy, kun ottaa huomioon, että nuorimmilla modaaliverbit (esimer- 
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kiksi haluan mennä) nostavat kompleksisuutta enemmän kuin aikuisilla. 
Muutoksia kaikkien käsiteltyjen sanaluokkien esiintymissä voi pitää ke- 
hityksellisinä, mutta erityisesti substantiivien ja verbien osuus on altis 
muuttumaan MLTU:n keskipituuden mediaanin mukaan: määrä on 
molemmilla suurempi, jos MLTU on alle mediaanin, ja silloin kyse on 
lähinnä yksinkertaisilla peruslauseilla etenevästä tekstistä. 


Taulukko 72. Sanaluokkaesiintymien vaikutus T-yksikön sanamääriin (alle/yli MLTU-me- 
diaanin). 


MLTU-mediaani / Adjek- Substan- Prono- Verbit Infini- Parti- 
Sanaluokka % tiivit tiivit minit tiivit siipit 
Kuudes MLTU alle 6 57 30,6 8,1 29,6 5,1 1,9 
Yhdeksäs MLTU alle 6,23 5,6 31,7 74 29,2 43 1,9 
Aikuiset MLTU alle 7,41 8,8 31,9 8,6 28,7 4,8 3,2 
Kuudes MLTU yli 6 5,4 29,7 9,6 27,6 6,5 2,2 
Yhdeksäs MLTU yli 6,23 73, 29,9 9.3 27,2 5,4 1,9 
Aikuiset MLTU yli 7,41 9,5 31,6 9,5 25,9 5,1 3,4 


Varsinaisiksi kompleksisuustekijöiksi on laskettu verbaaliset ainekset, 
joita tarkastellaan alaluokittelemalla ne muodon ja funktion mukaisesti 
(ks. taulukko 73). Lisäksi kompleksisuustekijöihin lukeutuvat alisteiset 
elementit, joita arvioimme suhteessa kaikkiin lauseita yhdistäviin ele- 
mentteihin. Beersin ja Nagyn (2009) mukaan kompleksisuustekijöiden 
vaikutus T-yksikön keskipituuteen ei olisi kertovassa tekstissä odotuk- 
senmukainen. Unelmakirjoitelmista näkyy selvästi, että finiittiverbien 
määrä laskee ikäluokkatason mediaanin noustessa ja toisaalta rektio- 
infinitiivejä ja muita ei-finiittisiä verbejä on joka ikäluokassa enemmän 
kirjoitelmissa, joiden MLTU on yli ikäluokkamediaanin. Vastaavasti 
lausetta alistavien elementtien määrä kaikista yhdistävistä on suurem- 
pi kirjoitelmissa, joiden MLTU on yli mediaanin. Kuudesluokkalaisilla 
alisteiset lauseet ovat sekä ali että yli mediaanin tapauksissa keskeisempi 
kompleksisuustekijä kuin muilla ryhmillä, sillä vaikka relatiivilauseet 
lisääntyvät kehityksellisesti, adverbiaalilauseet vähenevät. 
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Taulukko 73. Kompleksisuustekijöiden vaikutus MLTU:hun (alle/yli mediaanin). 


MLTU-mediaani / Finiitti- Rektio- Muut Alistavat 
Kompleksisuustekijä % verbit infinitiivit ei-finiittiset — yhdistävistä 
Kuudes MLTU alle 6 80 12,5 6,8 33,3 
Yhdeksäs MLTU alle 6,23 75 12,5 10,5 25 
Aikuiset MLTU alle 7,41 67,0 13,6 18,7 31,3 
Kuudes MLTU yli 6 73,3 15,6 9,1 42,3 
Yhdeksäs MLTU yli 6,23 69,2 16,6 12,8 35,9 
Aikuiset MLTU yli 7,4 61,7 16,8 21,2 415 


Kolmanneksi on arvioitu johdoksia ja johtamattomia sanoja sekä eri sa- 
naindeksejä T-yksikön ikäluokkamediaaniin (taulukko 74). Johdosten 
määrän tiedetään nousevan kehityksellisesti ja vastaava nousu koskee 
myös leksikaalista indeksiä, NTVR:ta sekä pronomini-substantiivi- 
indeksiä. Unelmakorpuksessa kuudesluokkalaisten sanarakenne ei muu- 
tu odotuksen mukaan suhteessa MLTU:n ikäluokkamediaaniin, mut- 
ta johdosten määrä kyllä kasvaa jonkin verran MLTU:n noustessa 
yhdeksäsluokkalaisilla ja aikuisilla. Toisin sanoen vaikka johdokset li- 
sääntyvät kehityksellisesti, ikäryhmittäin paljon johdoksia käyttävät eivät 
kirjoita kovin paljon pidempiä T-yksiköitä. Vastaavasti NTVR eriytyy vä- 
häisesti, ja vaikka suhde on korkeamman MLTU:n teksteissä korkeam- 
pi, ero on silti pieni. Leksikaalinen tiheys laskee pidemmissä T-yksiköis- 
sä. Tämä selittynee pronominien lisääntymisellä, koska ne vähentävät 
leksikaalisten sanojen käytön tarvetta. Pronominien suhteellinen osuus 
niiden ja substantiivien yhteisosuudesta kasvaa T-yksikön pidentyessä. 
Ero on sanaindekseistä selvin. 


Taulukko 74. Sanaindeksit ja MLTU (alle/yli mediaanin). 


MLTU-mediaani / Johdokset — Johta- NTVR  Leksikaa- — Pronomini- 
Sanaindeksit % mattomat linen tiheys substantiivi- 
indeksi 
Kuudes MLTU alle 6 11,7 71 51,7 76,1 21,1 
Yhdeksäs MLTU alle 6,23 13,3 69,4 51,2 76,8 19,8 
Aikuiset MLTU alle 7,41 19,7 65,6 52,7 78 art 
Kuudes MLTU yli 6 II 71,7 51,9 74,2 25,4 
Yhdeksäs MLTU yli 6,23 15,8 69,5 53 74,2 23,7 
Aikuiset MLTU yli 7,41 20,8 62,5 54,6 76,6 23,4 
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Kompleksisuusindeksiä (= CI) arvioidaan samalla tavoin kuin MLTU:ta 
eli jakamalla aineisto indeksin ikäluokkamediaanin avulla kahtia alle 
mediaanin ja yli mediaanin ryhmiin. Kuudennella mediaani on 1,55, 
yhdeksännellä 1,58 ja aikuisilla 1,67. Adjektiivien käyttö laskee komplek- 
sisuuden myötä mutta erot ovat jälleen pienet (ks. taulukko 75). Substan- 
tiiveja on enemmän alle mediaanin tapauksissa eli siis rakenteellisesti 
yksinkertaisemmassa tekstissä mutta kehityksellisesti määrä nousee 
kummassakin tapauksessa. Substantiivien rooli on toistamiseen vastoin 
ennakko-oletusta, sillä Ravidin (2006, 792) mukaan teksti on syntakti- 
sesti sitä kompleksisempaa mitä enemmän siinä on substantiiveja ja 
adjektiiveja. Verbien määrä on matalampi alle mediaanin tapauksissa, 
vaikka kehityksellisesti määrä laskee kummassakin ryhmässä. Myös 
infinitiivien käyttö on vähäisempää alle mediaanin tapauksissa, ja yli 
mediaanin tapauksissa näkyy kehityksellinen nousu, samoin on tilan- 
ne partisiippien osalta, mutta niiden kokonaisfrekvenssit ovat kaikissa 
ryhmissä pienet. 


Taulukko 75. Sanaluokkaesiintymien vaikutus kompleksisuusindeksiin (alle/yli mediaanin). 


CI-mediaani / Adjek- Substan- Prono- Verbit Infinitiivit — Partisiipit 
Sanaluokka % tiivit tiivit minit 

Kuudes CI alle 1,55 5,8 32,8 8,5 27,9 4,6 1,9 
Yhdeksäs CI alle 1,58 6,5 31,7 7,5 27,8 3,7 E7 
Aikuiset CI alle 1,67 933 32,9 8,6 26,9 4,3 3,2 
Kuudes CI yli 1,55 5,4 28,7 9,5 29,6 7,3 2,4 
Yhdeksäs CI yli 1,58 6,7 30,0 9,3 28,4 6,1 2,11 
Aikuiset CI yli 1,67 9,0 3LI 9,5 27,8 5,8 3,4 


Finiittiverbit, rektioinfinitiivit ja muut ei-finiittiset on laskettu verbien 
kokonaissanamäärästä (ks. taulukko 76); alistavien konjunktioiden 
osuus on laskettu kaikista lauseita ja lausekkeita yhdistävistä elementeis- 
tä. Näillä ns. kompleksisuustekijöillä on välttämättä vaikutusta komplek- 
sisuusindeksiin, koska kyse on piirteistä, joilla kompleksisuus on lause- 
tasolla määritelty. Mielenkiintoisempi tietysti onkin kysymys, paljonko 
tekijät eri ikäryhmissä vaikuttavat ja onko jokin tekijä näkyvämpi jossain 
tietyssä ikäluokassa. Finiittiverbien määrä laskee selvän kehityksellisesti, 
sillä eniten finiittiverbejä käytetään kuudensien kirjoitelmissa ja vähiten 
aikuiskirjoitelmissa. Lasku kompleksisuuden mukaan kulkee vastaavas- 
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ti. Rektioinfinitiivien määrä nousee huomattavasti mentäessä yli me- 
diaanin tapauksiin, ja vaikka määrissä on kehityksellinen kasvu, se ei ole 
kovin suuri. Muiden ei-finiittisten määrä nousee sekä kehityksellisesti 
että kompleksisuuden myötä, tosin aikuisilla ero on pieni. Alistavat ele- 
mentit lisääntyvät yli mediaanin tapauksessa ja nousu on 10 prosentti- 
yksikön luokkaa kaikissa ikäryhmissä. 


Taulukko 76. Kompleksisuustekijöiden vaikutus kompleksisuusindeksiin (alle/yli mediaanin). 


CI-mediaani / Finiittiverbit — Rektioinfinitiivit Muut Alistavat 
Kompleksisuustekijä % ei-finiittiset yhdistävistä 
Kuudes CI alle 1,55 81,2 11,3 6,3 33:3 
Yhdeksäs CI alle 1,58 76,5 11,6 10,3 25,0 
Aikuiset CI alle 1,67 67,4 12,5 19,6 30,8 
Kuudes CI yli 1,55 71,9 17,8 9,1 43:3 
Yhdeksäs CI yli 1,58 68,2 18,4 13,0 35,7 
Aikuiset CI yli 1,67 61,0 17,9 20,0 42,2 


Sanarakenteen kompleksisuus ei näytä vaikuttavan lausetason komplek- 
sisuuteen kovin selvästi (taulukko 77). Johdoksia on enemmän alle me- 
diaanin tapauksissa, mutta toisaalta niiden määrä kasvaa kehitykselli- 
sesti molemmissa tapauksissa. Johtamattomien sanojen määrä laskee 
kehityksellisesti mutta lausetason kompleksisuus hienokseltaan nostaa 
johtamattomien määrää. Tämä mitä todennäköisimmin johtuu pro- 
nominien, modaaliverbien ja yhdistävien elementtien lisääntymisestä, 
koska ne ovat pääosin johtamattomia ja lyhyitä sanoja. Vastaava kehitys 
näkyy pronominien ja substantiivien keskinäisestä suhteesta. Pronomi- 
nien käyttö laskee hieman kehityksellisesti mutta nousee kompleksisuu- 
den myötä. Leksikaalisissa indekseissä kompleksisuuserot ovat pieniä 
mutta pääasiassa NTVR-suhde ja leksikaalinen tiheys laskevat komplek- 
sisuuden myötä. Toisin sanoen kompleksisessa tekstissä on vähemmän 
substantiiveja kuin ei-kompleksisessa. Tämä voi heijastaa kompleksi- 
sen tekstin ei-finiittisten ainesten tiheyttä ja toisaalta ei-kompleksisen 
tekstin tyyppiominaisuuksia. Yleensä esimerkiksi erittelevän tekstin 
kompleksisuus on matalampi ja leksikaalinen tiheys korkeampi kuin 
kertovan, mutta Unelma-aineistossa erittelevämpiä tekstejä on liian vä- 
hän, jotta oletusta voisi näyttää toteen. 
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Taulukko 77. Sanaindeksit ja kompleksisuusindeksi (alle/yli mediaanin). 


CI-mediaani / 


Johdokset Johtamat- 


NTVR —Leksikaali- 


Pronomini-sub- 


Sanaindeksit % tomat nen tiheys — stantiivi-indeksi 
Kuudes CI alle 1,55 11,9 70,6 53,8 75,8 21,2 
Yhdeksäs CI alle 1,58 13,9 68,9 53:3 76,5 19,7 
Aikuiset CI alle 1,67 20,0 64,4 54,8 78,0 20,6 
Kuudes CI yli 1,55 10,8 72,5 50,0 74,7 25,3 
Yhdeksäs CI yli 1,58 15,1 70,3 51,5 74,6 23,2 
Aikuiset CI yli 1,67 20,2 64,1 52,7 76,8 23,9 


Lopuksi voi vielä tarkastella MLTU:n ja kompleksisuusindeksin keski- 
näistä suhdetta niiden mediaanien avulla (ks. taulukot 78—79). Lausera- 
kenteen kompleksisuus nousee selvästi T-yksikön sanamäärän kasvaessa 


ja vastaavasti sanamäärä nousee kompleksisuuden kasvaessa. Erot ovat 
hyvin selviä. On itsestään selvä, että kompleksisuus nostaa T-yksikön 


sanamääriä, mutta ei ole yhtä odotuksenmukaista, että korkempi MLTU 
liittyy korkeampaan kompleksisuuteen. Todennäköisesti kyse on siitä, 


että kirjoitelmat kuitenkin pääasiassa edustavat yhtä ja samaa teksti- 
tyyppiä, kertomuksia (tai niihin pyrkiviä tekstejä). Tulos osoittaa, että 


Beersin ja Nagyn hypoteesi siitä, että kertovan tekstin mittarina MLTU 


ei olisi pätevä, ei pidä paikkaansa suomen aineistossa. 


Taulukko 78. Indeksien suhde a:b. 


MLTU Kompleksisuusindeksi 
Kuudes MLTU alle 6 1,4 
Yhdeksäs MLTU alle 6,23 1,42 
Aikuiset MLTU alle 7,41 1,56 
Kuudes MLTU yli 6 1,75 
Yhdeksäs MLTU yli 6,23 1,8 

Aikuiset MLTU yli 7,41 1,83 


Taulukko 79. Indeksien suhde b:a. 


Kompleksisuusindeksi MLTU 
Kuudes CI alle 1,55 5,29 
Yhdeksäs CI alle 1,58 5:5 
Aikuiset CI alle 1,67 6,7 
Kuudes CI yli 1,55 6,79 
Yhdeksäs CI yli 1,58 7,43 
Aikuiset CI yli 1,67 8,5 
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Lopuksi 


Puhutun kielen rakenne ei yleensä ole kovin hierarkkinen eli kerroksel- 
linen eivätkä lauseet keskimäärin ole kovin pitkiä. On näkemyksiä, joi- 
den mukaan puhutussa kielessä yhden argumentin ilmaukset olisivat 
vallitsevia (vrt. Bybee & Hopper 2001). Kirjoitetussa kielessä rakenne on 
yleensä tiiviimpi ja informaatiota voidaan pakata yksittäisiin yksiköihin 
kerroksellisemmin. Kyse on ensi sijassa modaliteettierosta, joka syntyy 
kuulo- ja näköaistin eroista ja on yhteydessä lyhytkestoisen muistin ka- 
pasiteettiin: kielen auditiivinen ja visuaalinen prosessointi ovat hyvin 
erilaisia toimintoja ja rasittavat muistia eri tavoin. Myöhemmän kielen- 
kehityksen aikana pitäisi oppia ymmärtämään näitä modaliteettieroja ja 
toimimaan kummankin ehdoin kielen rakenteen tasolla ja lisäksi sopi- 
vin kielen resurssein. Tässä luvussa olemme tarkastelleet Unelmakirjoi- 
telmien avulla, miten kielen rakennetta tiivistetään oletuksenmukaisena 
lähtökohtana varhaisen kielenkehityksen aikana opittu puhutun kielen 
rakenne ja miten nuorempien ja vanhempien kirjoittajien tiivistämisen 
keinot eroavat toisistaan. Tiivistäminen toimii yksinkertaisesta komplek- 
siin sekä horisontaalisella eli rakenteita rikastavalla että vertikaalisella 
eli hierarkkisuutta nostavalla tasolla. Rajoitimme tässä yhteydessä ra- 
kenteelliseen, objektiiviseen kompleksisuuteen ja sivuutimme toimi- 
jaan suhteutetun kompleksisuuden, joka edellyttäisikin kokeellista tut- 
kimusotetta. Rakenteellinen kompleksisuus määriteltiin eri yksiköihin 
pakatun tiedon moninaistumisena siten, että yksinkertaiseen muotoon 
aina lisätään sitä tarkentavaa ainesta tai siihen alisteiseksi — tavalla tai 
toisella — merkittyjä uusia yksikköjä. Siten johtamaton sana, endosent- 
rinen lauseke ja yksinkertainen vain välttämättömistä argumenteista 
koostuva tilaa, tapahtumaa tai tekoa ilmaiseva lause ovat yksinkertaisia 
yksikköjä ja niiden kompleksistaminen voi tapahtua lisäämällä niihin 
uusia sanoja tai formatiiveja eli kieliopillisesti ilmaistuja merkityksiä. 
Samat rakenteelliset keinot ovat kompleksistamisen välineitä tekstityy- 
pistä riippumatta, mutta suhteet vaihtelevat. 

Tarkastelumme keskittyi jonkinasteisesti kertovaan tekstiin. Tavoit- 
teena oli luoda kuva ikäkausittain tyypillisestä rakenteen kompleksista- 
misesta ja toisaalta löytää kehityksellisesti muuttuvia keinoja tiivistää ja 
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rikastaa kertovaa tekstiä. Onko tuloksena oleva teksti helppoa, selkeätä 
tai ymmärrettävää, ei ole määriteltävissä rakenteesta käsin asteikolla yk- 
sinkertainen-kompleksinen eikä tutkijan näkemys yksin riitä sitä ker- 
tomaan. Lyhyesti voi tulosten perusteella todeta, että iän myötä komp- 
leksinen kirjoitetun kertovan tekstin rakenne alkaa muistuttaa sanoma- 
lehtikielen rakennetta. 

Luvussa tarkasteltiin kompleksisuutta hyödyntäen niin sanotun T-yk- 
sikön käsitettä ja arvioitiin paitsi T-yksikön sanamäärien myös sen pro- 
positiohin palautuvien alisteisten rakenteiden kasvua. Sanamäärätarkas- 
telu keskittyi sanaluokkakohtaisiin analyyseihin, joiden avulla pyrittiin 
selvittämään T-yksikön sanamäärien koostumusta, keskiarvoa (MLTU) 
ja kasvua. Hierarkiatasolla yksinkertainen T-yksikkö ilmaisee yhden 
merkityksen (väitteen), kompleksinen useampia siten, että nämä raken- 
netta kompleksistavat merkitykset ilmaistaan suhteessa pääväitteeseen 
alisteisina käyttäen keinoina joko sivulauseita tai ei-finiittisiä rakenteita. 
T-yksiköiden hierarkkista rakennetta tutkittiin niin sanottua kompleksi- 
suusindeksiä (CI) hyödyntäen laskemalla, kuinka monia ja minkälaisia 
alisteisia propositioon palautuvia rakenteita niissä keskimäärin on. T-yk- 
sikön sanamäärän kasvu ja siihen sisältyvien alisteisten rakenteiden kas- 
vava määrä toisaalta kertovat kompleksistumisesta. Kielenkäyttäjä itse 
on määritellyt T-yksikön rajat pisteitä käyttämällä ja ainoastaan päälau- 
seita rinnastavat virkkeet on analyysissä erotettu kahdeksi yksiköksi pis- 
teistä piittaamatta, koska ne eivät ole keskenään alisteisia. T-yksikkö siis 
kertoo, miten kielenkäyttäjä on halunnut rikastaa ja nivoa tapahtumia 
yhteen ja selittää niiden ajallisia, kausaalisia ja spatiaalisiakin suhteita. 
T-yksikkö on siten kehityksellinen yksikkö, ja analyysi paljastaa osaltaan 
tekstin globaalikoherenssia ja sen vähittäistä kehittymistä iän mukaan. 

Sanaluokkakohtaisessa analyysissä tutkittiin adjektiivien, substantii- 
vien, pronominien ja verbien suhteellisia osuuksia, osuuksien muutok- 
sia eri ikäryhmissä ja vaikutusta sanamääriin. Ikäryhminä olivat osaksi 
mukana kaikki alakoululaiset tai vain kuudennet, yläkoululaisista yhdek- 
säsluokkalaiset sekä nuoret aikuiset. Kaikkien tarkasteltujen sanaluok- 
kien osuuksissa tapahtuu kehityksellisiä muutoksia: adjektiivien määrä 
nousee kehityksellisesti, ja kertovassa tekstissä tavoitemäärä on 6-10 
prosenttia sanaesiintymistä. Naiskirjoittajilla adjektiivimäärä on kaikissa 
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ikäluokissa korkeampi kuin mieskirjoittajilla. Substantiivien määrä niin 
ikään kasvaa, kunnes niitä on suunnilleen 30-40 prosenttia sanaesiin- 
tymistä. Pronominien rooli on kahtalainen ja persoonapronominit ja 
muut pronominit vaikuttavat kompleksistumiseen eri tavoin. Persoo- 
napronominit lisääntyvät kyllä nuorimmilla kirjoittajilla kehityksellises- 
ti samalla kun kertovan tekstin määrä kasvaa, mutta ne eivät pidennä 
T-yksikköä eivätkä nosta kompleksisuutta. Muut pronominit määrittävät 
usein substantiiveja ja lisäävät silloin lausekkeiden sanamääriä. Prono- 
minien tavoitemäärä kertovassa tekstissä on 5-10 prosenttia sanamää- 
rästä. Verbien osuus kokonaissanamäärästä on kaikissa ikäryhmissä 
samantapainen: mediaani on hieman alle 30 prosenttia, ja kuudesluok- 
kalaisista lähtien yleisyysluokka 20-30 prosenttia on vallitseva. 
T-yksikön keskipituuteen (MLTU) sanoina eri sanaluokat vaikuttavat 
eri tavoin. Lisäksi on ikäkausi- ja sukupuolivaihtelua. Adjektiivit nosta- 
vat nuorimmilla MLTU:ta mutta eivät enää niinkään muilla. Myös sub- 
stantiivien vaikutus on sanamääriä nostava mutta enemmän nais- kuin 
mieskirjoittajilla. Pronominien vaikutus on positiivinen. Verbimäärät 
pysyvät samoissa, mutta jos verbiluokka jaetaan finiittisiin ja ei-finiitti- 
siin, löydetään aineiston suurimmat kehitykselliset kompleksistumis- 
erot: finiittiverbien määrä laskee iän myötä yli 20 prosenttiyksikköä ja 
ei-finiittisten määrä kasvaa. Kuudesluokkalaiset kirjoittavat aika vahvasti 
finiittiverbien varassa pää- ja sivulauseita käyttäen ja rikastavat tekstiään 
adjektiivein. Myös naiskirjoittajilla finiittiverbien määrä on yleensä kor- 
keampi kuin mieskirjoittajilla. Finiittiverbien korkea määrä yleensä las- 
kee T-yksikön sanamääriä, koska teksti etenee yhden proposition T-yksi- 
köillä eli yksinäislauseilla. Tällaisen tekstin globaalikoherenssi täytyy 
lukijan yleensä pitkälti päätellä. Rektioinfinitiivit ja muut ei-finiittiset 
ainekset lisääntyvät kehityksellisesti, niiden tyyppimäärä on tiheysluo- 
kassa 10—20 prosenttia verbiesiintymistä. Muita ei-finiittisiä on perus- 
koululaisilla 5-10 prosenttia verbiluokasta, mutta aikuisilla määrä on jo 
yli 20 prosenttia. Verbiluokan sisällä siirtymä finiittisistä ei-finiittisiin 
nostaa T-yksikön sanamääriä ja on hyvin selvä kehityksellinen piirre. 
Fi-finiittiset ainekset tosin koostuvat nuorilla eri aineksista kuin van- 
hemmilla. Erityisesti kuudesluokkalaisilla on paljon modaaliverbeihin 
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liittyviä infinitiivimuotoja (esimerkiksi haluan/saan mennä), mutta iän 
myötä ei-finiittiset ainekset monipuolistuvat. 

Jos T-yksikön sanamäärät kasvavat peruskoululaisilla pääosin kehi- 
tyksellisesti, ne nuorimmat kirjoittajat, joilta puuttuvat määrittävät sanat 
kuten adjektiivit tai ylipäätään sanat, jotka eivät ole argumenttiasemassa, 
eivät ole vielä saavuttaneet ikäluokkansa keskiverto-osaamista. Tilanne 
on nuorilla aikuisilla moninaisempi, koska heillä T-yksikön sanamäärä- 
vaihtelu liittyy usein tyylivalintoihin. Osa aikuisista kirjoittaa komplek- 
sisesti, osa hyvin yksinkertaisesti; edellisillä on korkea sanamäärä ja 
kompleksisuus, jälkimmäisillä T-yksikössä on vähän sanoja ja samoin 
lauseita. Kehityksellisesti kompleksisempi tyyli on parempi mutta laa- 
dullisesti tyylejä ei voi arvottaa. Peruskoulun kuudensilla on vielä jonkin 
verran poikkeavia arvoja, peruskoulun tytöillä tulee esiin finiittiverbejä ja 
adjektiiveja suosiva kirjoitustyyli. Peruskoulun kuudennen ja yhdeksän- 
nen pojista odotuksenmukaista suurempi osuus edustaa niin sanottua 
suoraa viivaa tai nollalinjaa monen muuttujan suhteen: kirjoitelmissa ei 
ole mitään tekstiä rikastavaa tai kompleksistavaa ainesta ja muuttujien 
arvot eivät sijoitu nousevalle linjalle. Jopa substantiivi-verbisuhde voi 
olla epätavallinen, mikä antaa viitteitä siitä, että tavoite tai tulos ei ole 
kertovaa tekstiä. Jopa kymmenisen prosenttiakin näistä pojista kirjoittaa 
ongelmatekstiä, vaikka odotusarvo olisi korkeintaan 2-3 prosenttia. 

Nominaaliset sanaluokat eivät yleensä vaikuta suoraan T-yksikön hier- 
arkkiseen kompleksisuuteen mutta välillisesti esimerkiksi korkea sub- 
stantiivimäärä voi olla seurausta useista alisteisista rakenteista. Vastaa- 
vasti korkea pronominimäärä voi liittyä runsaaseen ei-finiittisten tai alis- 
teisten lauseiden määrään. Adjektiivit eivät nosta kompleksisuutta mut- 
ta liiittyvät nuorilla tytöillä kompleksiseen tekstiin. Ei-finiittiset ainekset 
ja sivulauseet nostavat kompleksisuusindeksiä keskeisesti sanamää- 
rien lisäksi. Rektioinfinitiivien korkea määrä liittyy usein tulevaisuus- 
hakuiseen tekstiin, kirjoitetaan siitä, mitä halutaan tulevaisuudessa saa- 
da, minne mennä ja mitä tehdä, mutta muilla ei-finiittisillä rakenteilla 
voidaan käsitellä myös menneisyyttä ja tuoda esiin ajallisia kerrostumia. 
On selvä, että jälkimmäinen on kehityksellisesti merkitsevämpi kuin 
edellinen. 
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Alisteiset sivulauseet nostavat sekä sanamääriä että kompleksisuus- 
indeksiä kaikilla kirjoittajilla. Alisteiset lauseet jaettiin komplementti-, 
adverbiaali- ja relatiivilauseisiin. Komplementtilauseet ovat puheakti- ja 
mentaaliverbien lauseargumentteja, ne eivät vanhemmilla peruskoulu- 
laisilla enää lisäänny kehityksellisesti, mutta siirtymä referoivasta puhe- 
aktista propositionaalisia asenteita, tunteita ja ajatuksia kielentäviin 
mentaaliverbeihin on kehityksellinen. Lausemuotoisten adverbiaalilau- 
seiden määrä laskee kehityksellisesti. Kertovassa tekstissä temporaaliset 
ja kausaaliset sivulauseet ovat keskeiset adverbiaalilauseiden ryhmät. 
Sekä komplementtilauseet että temporaalilauseet voidaan korvata lau- 
seenvastikkeilla ja aikuiskirjoitelmissa temporaalirakenteita on kolmi- 
sen kertaa enemmän kuin referentiaalisia rakenteita; niitä on erityisesti 
miesten kirjoitelmissa. Temporaalinen lauseenvastike kasvaa kehityksel- 
lisesti etuasemaisena, narratiivisena tai päälauseen kanssa myös taka- 
asemassa päällekkäistä tapahtumaa kielentävänä. Monista kielistä esitet- 
ty relatiivilauseiden kehityksellinen kasvu on totta myös suomen kielen 
kohdalla. Siirtymä sivulauseen kuvailevasta funktiosta narratiiviseen on 
kehityksellinen ja vastaavasti sekä ei-lineaaristen ja etuasemaisten rela- 
tiivilauseiden lisääntyminen. 

Myöhemmän kielenkehityksen tutkimushankkeessa yksi lähtökohta- 
oletus oli, että tilastolliset eli allomorfiset sukupuolierot jakautuvat 
Gaussin käyrän mukaisesti siten, että enemmistö ihmisistä sijoittuu 
jakauman keskialueelle, jossa on paljon päällekkäisyyttä. Äärialueille 
sijoittuu 2-3 prosenttia ihmisistä. Sukupuolieroja on arvioitu hyvin mo- 
nella tapaa hankkeessa ja tulosten yleistys on, että jakauma on monen 
ominaisuuden suhteen odotuksenmukainen. Frityisesti sanastossa ja 
sekä semanttisen että morfologisen tiedon osalta erot ovat suhteellisen 
pienet tosin siten, että naisilla hallinta kulkee nopeampaa tahtia kuin 
miehillä, ja siten, että miesten tuloksia sijoittuu ääriarvoille — asteikon 
molempiin päihin —- enemmän kuin naisten. Nämä tulokset ovat erään- 
laisia monissa yhteyksissä esiin tulleita yleisiä totuuksia. Tekstitasolla 
substantiivien ja verbien suhteellinen osuus ja T-yksiköiden keskipituus 
eivät ole sukupuolittain erottelevia tekijöitä mutta jossain määrin erilais- 
tavia ovat adjektiivien osuus, joka tytöillä ja naisilla on aina korkeampi 
kuin pojilla ja miehillä, ja toisaalta ei-finiittisten ainesten osuus verbi- 
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luokasta, joka pojilla ja mieskirjoittajilla on keskimäärin korkeampi kuin 
tytöillä ja naisilla. T-yksikköjen rakenteellinen kompleksisuus on niin 
ikään miehillä selvästi korkeampi kuin naisilla ja korkeampi kompleksi- 
suus tulee esiin jo kuudennen luokan pojilla, vaikkakaan heillä ei aina 
ole kompleksisuuden ilmaisun keinoja hallinnassaan. 
Unelmakirjoitelmat edustavat kehityksellisesti kertovaa tekstiä. Kuu- 
desluokkalaisista kirjoittajista Go prosenttia ei vielä täysin hallitse kerto- 
musskeemaa — jonka hallintaa odotetaan jo 1o-vuotiailta — ja heidän kir- 
joittamansa tekstit ovat paitsi lyhyitä, myös melko yksinkertaisia. Aiheita 
voi olla käsittelyssä useitakin, mutta yksittäisestä aiheesta kirjoitetaan 
vähän, mikä pirstaloi myös rakennetta. Yhdeksäsluokkalaiset kirjoittavat 
pääosin kuudesluokkalaisia pidempiä ja hieman kompleksisempia ker- 
tomuksia. Tyttöjen tekstit alkavat ominaisuuksiltaan muistuttaa nuorten 
aikuisten tekstejä, pojat tuottavat paljon myös ongelmatekstejä. Nuorten 
aikuisten kirjoitelmien rakenteelliset ominaisuudet muistuttavat mones- 
sa suhteessa sanomalehtikielen ominaisuuksia. Erot näkyvät parhaiten 
kirjoitelmien adjektiivien suuresta määrästä, korkeammasta verbitihey- 
destä ja referointiin liittyvien keinojen vähemmästä määrästä. 
Unelmakirjoitelmien ja lehtitekstin erot syntyvät osin tekstityyppi- 
eroista. Unelmakirjoitelmat ovat pääosin kertomuksia — aikuisilla melko 
hyviä — ja eritteleviä tekstejä on melko vähän. Lehtiteksti koostuu mo- 
nista tekstilajeista, vaikka kertovan tekstin osuus on suuri. Frityisesti 
uutiset on kirjoitettu kertomustyyliin, samoin monet raportit ja haastat- 
telut. Lähinnä esimerkiksi arvioivat tekstit ja pääkirjoitustekstit edusta- 
vat erittelevää ja arvioivaa tekstityyppiä. Siten on ymmärrettävää, että 
nuorten aikuisten kirjoitelmilla ja sanomalehtiteksteillä on ehkä odo- 
tettua vähäisemmät rakenteelliset ja tilastolliset erot. Kun molempien 
näytteet on kerätty 2000-luvun alusta, ne edustanevat samaa kielellistä 
kompleksisuuden muotia. Rakenteellinen kompleksisuus näet paitsi 
kasvaa kehityksellisesti, myös vaihtelee ajallisesti. Siten 1970-luvun 
kompleksinen muoti poikkeaa 2010-luvun yksinkertaisemmasta muo- 
dista. Mutta jos rakenne on paitsi yksinkertainen myös hajanainen, kyse 
ei ole enää muodista vaan kehityksen ongelmista. Kuudesluokkalaiset 
kirjoittivat vuonna 2006 unelmapäivästään tiiviimmin kuin vuoden 
2014 kuudesluokkalaiset, ero näkyy nimenomaan globaalikoherenssin 
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hajanaistumisena. Tämä on yksi merkki trendin laskusuuntaisuudesta 
suurten matalien ääriarvojen lisäksi. 

Lopuksi voi kysyä, onko koululaisten kirjoitelmista ilmenevä raken- 
teellinen kielenhallinta odotuksenmukainen. Vastaus on kyllä, jos kiin- 
nitetään huomio ikäryhmittäiseen keskimääräiseen osaamiseen. Vastaus 
on ei, jos kiinnitetään huomio ääriarvojen odotuksenmukaista suurem- 
paan määrään. Vastaus on vähintään epäröivä, jos kiinnitetään huomio 
kompleksisuustekijöiden yksipuolistuvaan ja haparoivaan käyttöön. Ja 
lopuksi, vaikka heikkoa suoriutumista voi selittää esimerkiksi (ulkoisen) 
motivaation puutteella, kirjoittajaksi kehittyy vain kirjoittamalla. Siksi 
huolimatta kielenhallinnan tasosta, heikko kirjoittaminen voi olla opis- 
kelun ja urapyrkimysten este vielä aikuisenakin. 
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Abstract 


Later language development in Finnish. School-age children and young adults 


The topic of the book is the incremental growth of linguistic knowledge 
from lexical to structural-cum-textual during the so-called later language 
development. Language mastery does not presuppose any acquaintance 
with prescriptive grammar but, instead, concerns the core of language 
which the so-called consensus principle applies to: the most frequent 
words and structures are mastered with certainty by everybody, but un- 
certainty increases as less frequent and more variable phenomena are 
taken into consideration. It is the goal of the study to make explicit the 
knowledge that is common to school children of different age groups, 
and to show how it develops both in its core and in its fringe areas. 
The mastery of less common aspects exhibits considerable statistical 
variation. The research embodies methodological pluralism insofar as 
it has been carried out by means both of the corpus method and the 
experimental method. Here experimental subsumes writing tasks, pa- 
per-and-pencil tests, and behavior under experimental conditions. The 
amount of participants native in Finnish varies from 300-2000. The 
book has a bipartite structure: mastery of meanings (Part I), and mas- 
tery of forms (Part II). 
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verbisanasto 102 

sanatieto, ks. tieto 

sanavalinta 62, 241, 306, 317, 320, 327, 330, 
332, 333, 335, 345, 346 

sanavarasto 10, 13, 104, 309 

sanavartalo 13, 76, 288, 317, 325, 334, 342, 
346 
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sanelukirjoitus 303, 316, 340 

sanue 66, 67, 68 

satelliitti 112 

satelliittikehyskieli 112, 116, 149, 150 

sidoksisuus 230, 391, 404 

sija 66, 123, 124, 128-130, 148, 272, 287— 
290, 292, 344 
paikallissija 129, 150, 152, 289, 290, 292, 
332, 342-344, 383 
rektiosija 314, 330 

sijakieli 112, 149 

sijamuoto 114, 274, 275, 289, 314, 342, 383 

sijataivutus 320, 332, 383, 437 

sijavalinta 170, 342, 343, 344 

sitaatti 213, 224, 408 

skeema 17, 33, 34, 242, 399 
kertomusskeema 17, 34, 96, 100, 212, 238, 
242, 377, 392, 399, 475 

skripti 96, 169, 170, 174, 399, 400 
päiväskripti 90, 100 

sosiolingvistiikka 252, 253, 258 

spatiaalinen siirtymä 112—115, 128, 130—132, 
135, 144, 146 

spesifisyys 18, 40, 45, 373, 385 

spesifisyysaste (granularity) 381, 383 

stimulus 24, 43, 44, 111, 116, 126, 148, 150 

strategia 60, 72, 100, 116, 168, 169, 263, 
308, 332, 359, 364, 380 
hahmottamisstrategia 169, 364 
kerrontastrategia 72, 231 
kielentämisstrategia 24, 25, 43, 142, 359 
kirjoittamisstrategia 359, 409, 428, 447 

subjekti 163, 166, 170, 180, 181, 249, 259, 
260, 264, 274, 285, 322, 342—344, 346, 
372, 375, 392, 427, 458 

substantiivi 33, 66, 69, 75, 77, 78, 84-94, 
102, 106, 111, 129, 150, 164, 171, 172, 176, 
189, 190, 272, 274-278, 281, 288, 289, 
291, 374, 379, 383, 390-396, 429, 431, 434, 
436-438, 440, 441, 445, 464-468, 471, 
472, 474 

substantiivilauseke, ks. lauseke 

substantiiviperhe, ks. perhe 

substantiivisanasto, ks. sanasto 
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substantiivitiheys, ks. tiheys 

substantiivi-verbi-indeksi, ks. indeksi 

suffiksaatio 313 

sujuvuus 307, 311, 312, 317, 323, 328, 329, 
357, 363 

sukupuoli 11, 12, 19—23, 39, 43, 49, 77, 81, 
82, 101, 103, 176, 177, 186, 187, 189, 196, 
210, 212, 329, 332, 333, 338, 346, 370, 376, 
378, 379, 381, 383, 386, 388, 389, 397, 406, 
407, 413, 416, 428, 429, 432, 434, 436, 
446, 447, 450, 453, 458, 462, 472 

sukupuoliero 11, 19, 20, 22, 26, 43, 46, 49, 
105, 186, 383, 389, 413, 433, 459, 474 

suomi toisena kielenä 29, 31, 35, 38, 154, 
244, 252, 304, 306, 309, 311, 312, 316, 
317, 321, 323-325, 328, 332, 333, 336-349, 
351-353, 355, 356, 373 

suoritus (accomplishment) 113, 146 

suunnittelu 16, 31, 32, 100, 102, 162, 369, 
388 

suunta (direction) 43, 44, 109, 110-114, 119, 
123, 125, 127-151, 153 
vertikaalinen suunta 127, 133, 146, 147 


T 

taitodiskurssi 302, 303, 305, 310 

taitotaso 64, 215, 312, 346, 348, 351, 352, 
361, 373 

taivutusmuoto 66—68, 78, 101, 272, 273, 
278, 321, 342—344 

tajunnanvirta 234, 236, 241 

tapahtuma 16, 24, 28, 29, 33, 34, 43, 44, 
49, 59, 69, 85, 86, 88, 89, 93, 96, 99, 100, 
105, 109, 134, 155-157, 159, 160, 164, 167, 
168, 169, 174, 175, 182, 184, 185, 187, 188, 
203, 204, 209, 211, 218, 223, 225, 234, 
241, 279, 280, 368, 382, 384, 391, 395, 
399, 402, 405, 407, 409, 421, 456, 470, 
471, 474 

tapahtumajärjestys 25, 33, 34, 156, 191, 405, 
408, 409, 421 

tarina 9, 10, 16, 17, 25, 28, 32, 33, 157, 165, 
175, 178, 201, 207, 209, 218, 219, 226, 231, 
232, 367, 412, 461 


sammakkotarina 207, 229, 230, 239 

tarkenne 171, 179, 172, 173, 178, 180, 189, 
190, 191, 193, 285 
pronominitarkenne 172, 173, 190, 191 
se-tarkenne 158, 163, 172, 188, 189, 190, 
191, 194 

tarkkaavuus 348, 350, 354, 355, 356 

tarkkuus 47, 59, 109, 302-310, 312-319, 
321-329, 335, 337, 344, 346-349, 351, 352, 
354-356, 358-360, 381 
epatarkkuus 305, 306, 311, 323, 325, 330, 
336, 337, 339, 341, 344, 352, 355 

tarkoite 43, 44, 86, 93, 94, 102, 156, 158, 
161, 164, 169, 170-173, 177, 181, 188-191, 
193, 194, 221, 285, 368, 391, 395, 431, 440 
tuttu tarkoite 170, 173, 176, 178, 179, 190, 
191, 194 
uusi tarkoite 44, 188, 191 

tavoitemuoto 34, 203, 309, 322, 339, 346, 
347 

tavu 311, 325, 336, 340 

teko 90, 92, 96, 97, 282, 283, 456, 470 

teksti 
argumentoiva teksti 24, 34, 369, 408, 411 
arvioiva teksti 35, 100, 293, 475 
erittelevä teksti 33, 157, 160, 203, 293, 388, 
391, 397, 408, 409, 412, 427, 437, 468, 475 
kertova teksti 16, 17, 33-35, 41, 44, 45, 49, 
72, 84, 99, 100, 155-160, 167-170, 173, 
180, 200, 202, 209, 214, 225, 248, 279, 
321, 368-370, 374, 380, 386, 390, 391, 394, 
396-399, 407, 409, 411, 412, 427, 431, 438 
442, 459, 465, 469, 470-475 
kuvaileva teksti 369, 380, 391, 409 

tekstilaji 17, 47, 72, 167, 168, 181, 193, 200, 
209, 224, 254, 268, 271, 276, 277, 279, 
291, 292, 293, 305, 310, 321, 360, 370, 394, 
395, 426, 475 

tekstimerkitys 59, 60 

tekstittömyys 159 

tekstityyppi 16, 17, 25, 33-35, 74, 97, 99, 
167-169, 174, 183, 186, 187, 193, 194, 202, 
203, 206, 237, 271, 293, 370, 374, 377, 379» 
388, 390-392, 411, 469, 470, 475 
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tempus 200, 204, 232, 240, 241, 343, 396, 
448, 454 

testi 11-13, 19, 20, 27-30, 35-39, 49, 66, 68, 
76, 77, 85, 89, 91, 101, 106, 117, 164, 165, 
316, 317, 329, 349, 377 

testihäly 165 

tieto 
kulttuurinen tieto 157, 163, 310 
maailmantieto 114, 130, 159, 321 
sanatieto 9, 11-15, 26, 29, 30, 43, 59, 60, 
61, 63, 66 
semanttinen tieto 20-22, 26, 42, 101, 474 
tiedostamaton tieto 8 
tietoinen tieto 8 
tuttu tieto 44, 160, 163, 285 
uusi tieto 160, 162, 163, 166 
yhteinen tieto 9, 191 

tietoisuus 
morfologinen tietoisuus 53, 104, 383, 417 
foneettinen tietoisuus 317 
metakielinen tietoisuus 220 

tiheys 16, 177, 186, 189, 319, 330, 331, 337, 
373, 381, 395, 396, 398, 412, 432, 433, 445, 
451, 453, 460, 464, 466, 468, 469 
adjektiivitiheys 431-435 
esiintymistiheys 178, 194, 309, 328, 342, 
432 
leksikaalinen tiheys 84, 390, 391, 395-399, 
401, 402, 410, 412, 413, 437, 440, 441, 468 
pronominitiheys 441-444 
sivulausetiheys 459 
substantiivitiheys 24, 374, 436-438 
tekstitiheys 318, 325, 338, 340, 342, 347, 349 
verbitiheys 446, 449 
virhetiheys 315, 316, 322-327, 329, 330, 
342, 347-350, 355, 356 

tiiviys 19, 84, 374, 375, 387, 403, 413, 425, 
427, 428 

tila 43, 85, 88, 92, 93, 96, 133, 456, 470 

toiminnan esittaminen (re-enactment) 201 

toisteisuus 76, 78, 86, 87, 95, 169, 395, 412, 
445 

topiikki 157, 159, 166 

topologinen relaatio 121, 274 
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tuottaminen 17, 45, 49, 62, 63, 157-159, 
164-167, 178, 193, 206, 211, 217, 239, 240, 
285, 304, 305, 310-313, 316, 325, 357, 370, 
413, 424 

tuttuus 13, 29, 66, 86, 159, 160, 161, 173, 
189, 191, 192, 338, 426 
oletettu tuttuus 158, 161-164, 192 
pääteltävä tuttuus 161 

T-yksikkö (terminal unit) 156, 226, 315, 323, 
369, 375, 388, 389, 402-409, 412, 413, 
427-434, 437-439, 443, 446-451, 453, 454, 
457-459, 461, 464-466, 469, 471-475 

täydennysjakauma 290, 292 


U 
U-käyrä 239, 254 


V 

variaatio 23-26, 42—44, 46, 53, 60, 65, 79, 
108—111, 115, 116, 120, 136, 148, 149, 165, 
166, 207, 227, 248, 250, 253, 264, 267, 275, 
285, 287-290, 318, 370, 374, 437, 446, 447 

vastaanottaja 155-157, 159—163, 166, 167, 
169, 171, 172, 191, 192, 200, 203, 218, 233, 
314 

verbi 66, 67, 69, 70, 74-76, 78-80, 84-87, 
95-97, 99, 112, 116, 124, 126-128, 133, 
135-138, 143, 146, 148, 150, 168, 174, 176, 
189, 202, 207, 209, 227, 228, 233, 250, 
262, 268, 274-278, 289-291, 323, 332, 
342, 343, 352, 357, 364, 374, 382, 390-396, 
426, 428, 429, 431, 437, 438, 444-450, 
452-456, 458, 461, 464, 465, 467, 471, 
472, 474 
deiktinen verbi 127, 136 
emootioverbi 96, 456 
finiittiverbi 291, 390, 426, 431, 434, 438, 
447-450, 452, 456, 457, 465-468, 472, 473 
intransitiiviverbi 392, 426 
kieltoverbi 337 
kognitioverbi 96, 97, 456, 461 
kommunikaatioverbi 96 
liikeverbi 12, 13, 34, 76, 77, 96, 112, 113, 
127 
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mentaaliverbi 96, 456, 457, 474 
modaaliverbi 374, 395, 396, 447, 448, 464, 
468, 472 
puheaktiverbi 202, 207, 208, 227, 229, 
230, 231, 456, 457, 462 
suuntaverbi 127, 136, 150 
tapahtumaverbi 43, 96, 99 
tapaverbi 115, 116, 126, 135, 138, 150 
tekoverbi 96, 97 
tilaverbi 96, 97 
vaylaverbi 115, 124, 126-128, 142, 150 

verbikehyskieli 112, 115, 116, 150 

verbiketju 343, 345, 346 

verbiluokka 34, 97, 126, 150, 278, 291, 431, 
456, 457, 472 

verbimuoto 78, 267, 270, 275-279, 289, 
290, 332, 374, 448, 450, 452-456 

viitekehys (frame of reference), spatiaalinen 
109, 110, 113, 124, 132, 133, 302 

viittaus, kielellinen 40, 45, 159, 165, 166, 
180, 188, 211-214, 216, 236, 238, 293 

viittausketju 16, 157, 189 

viittaussuhde 40, 156, 158, 160, 165, 167, 
171, 191, 192, 206, 207, 238, 241, 285, 286, 
298, 332, 333, 399, 427, 429 

virhe 
alkukirjainvirhe 324, 327, 330, 331, 333-335, 
geminaattavirhe 338, 339, 341 
kongruenssivirhe 330, 332, 343 
piirtovirhe 330, 331, 334, 335, 341, 342 
sanajärjestysvirhe 324 
sanarajavirhe 336 
yhdyssanavirhe 330, 336, 378 
äännekestovirhe 318, 338 

virheettömyys 302, 315, 351 

virke 15, 156, 159, 175, 176, 210, 215, 219, 
311, 322, 323, 328, 345, 346, 402, 403, 407, 
408, 423, 426, 427, 429, 459, 471 

virkeraja 225, 318, 333 

virkerakenne, ks. rakenne 


vokaali 268, 287, 288, 311, 318, 330—332, 334, 
335, 338-341, 355 

vokaaliharmonia 341 

vokaalisointu 332, 341 

vuorovaikutus 45, 46, 62, 199, 213, 217, 218, 
231, 233, 240, 242, 246, 248, 258, 307, 
309, 357 

välimerkki 202, 207, 225, 228, 229, 241, 318, 
319, 324 

väylä (path) 43, 44, 108, 109, 110-116, 119— 
122, 124-129, 131-138, 140-142, 144-148, 
150, 151 

väyläinformaatio 124, 150 


Y 

ydin 11, 78, 248, 256, 257, 264, 415, 429 

yhtenäisyys 44, 169, 191, 302 

yksimielisyysperiaate (consensus principle) 9 

yksinkertaistuminen 287, 312 

yksinkertaisuus 100, 327, 372, 425 

yleisyystaso 15, 65, 66, 72, 75-79, 94, 96, 
99, 101, 102, 347 

ymmärtäminen 14, 40, 49, 53, 76, 104, 157, 
158, 159, 163, 164, 165, 203, 206, 239, 310, 
422, 424 


A 
älykkyys, kielellinen 12, 20, 21, 23, 27, 354, 
385, 414 
ääni 209, 229, 233, 234, 235, 236, 244 
henkilön ääni 209, 233 
kertojan ääni 232, 233 
minän ääni 234 
vieras ääni 234, 236 
äänisyys 
kaksiäänisyys 234 
moniäänisyys 15, 19, 35, 40, 45, 59, 60, 
199-201, 203-209, 211—214, 216—218, 
222—224, 226, 232—239, 242, 277, 368 
äänne-kirjain-vastaavuus 47, 247, 310, 311 
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